MIT istraživači razvili tehniku za kombiniranje više izvora podataka u robotici
Istraživači s MIT-a razvili su novu tehniku za obuku višefunkcionalnih robota koristeći generativnu umjetnu inteligenciju poznatu kao difuzijski modeli. Ova tehnika omogućava robotima da kombiniraju podatke iz različitih izvora, modaliteta i zadataka, što im omogućuje izvođenje više zadataka u različitim okruženjima.
Tradicionalni pristupi treniranju robota često koriste samo jedan tip podataka, što ograničava sposobnost robota da izvode nove zadatke u nepoznatim okruženjima. U cilju poboljšanja performansi robota, MIT istraživači razvili su pristup poznat kao Policy Composition (PoCo) koji omogućava robotima da koriste kombinirane strategije iz više izvora podataka.
PoCo koristi difuzijske modele za učenje strategija za izvršavanje specifičnih zadataka. Svaki model se trenira s različitim skupom podataka, a zatim se kombiniraju politike naučene iz tih modela kako bi se stvorila opća politika koja omogućuje robotu da izvršava više zadataka u različitim okruženjima.
Kombiniranje raznolikih skupova podataka
U robotici, politika je strojno učenje modela koji koristi ulazne podatke za izvršavanje akcije. MIT istraživači koriste difuzijske modele kako bi generirali putanje robota. Ovi modeli uče dodajući šum podacima u skupu za treniranje, a zatim postupno uklanjaju šum kako bi poboljšali izlaz.
Ova tehnika omogućuje robotima da generiraju nove uzorke podataka koji nalikuju uzorcima iz skupa za treniranje, ali umjesto generiranja slika, oni generiraju putanje robota. PoCo je nadogradnja tehnike poznate kao Diffusion Policy, koju su prethodno razvili istraživači s MIT-a, Sveučilišta Columbia i Toyota Research Institutea.
Prednosti nove tehnike
Jedna od glavnih prednosti PoCo pristupa je mogućnost kombiniranja politika kako bi se postigli bolji rezultati za određeni zadatak. Na primjer, politika trenirana na stvarnim podacima može postići veću spretnost, dok politika trenirana na simuliranim podacima može postići veću generalizaciju.
Zbog odvojenog treniranja politika, moguće je kombinirati politike kako bi se postigli optimalni rezultati za određeni zadatak. Također, moguće je dodati podatke u novom modalitetu ili domeni tako što se trenira dodatna Diffusion Policy s tim skupom podataka, bez potrebe za ponovnim pokretanjem cijelog procesa.
Rezultati testiranja
Istraživači su testirali PoCo u simulaciji i na stvarnim robotskim rukama koje su izvodile različite zadatke s alatima, poput korištenja čekića za zabijanje čavala i okretanja objekata lopaticom. PoCo je doveo do 20-postotnog poboljšanja u performansama zadatka u usporedbi s osnovnim metodama.
Ovaj pristup omogućava stvaranje bolje integriranih putanja koje nadmašuju pojedinačne putanje trenirane na odvojenim skupovima podataka.
Budući ciljevi
U budućnosti, istraživači žele primijeniti ovu tehniku na zadatke s dugoročnim ciljevima, gdje bi robot mogao uzeti jedan alat, koristiti ga, a zatim preći na drugi alat. Također žele uključiti veće skupove podataka iz robotike kako bi poboljšali performanse.
Ovo istraživanje djelomično financiraju Amazon, Singapurska agencija za obrambenu znanost i tehnologiju, Nacionalna zaklada za znanost SAD-a i Toyota Research Institute.
Kreirano: utorak, 11. lipnja, 2024.
Napomena za naše čitatelje:
Portal Karlobag.eu pruža informacije o dnevnim događanjima i temama bitnim za našu zajednicu. Naglašavamo da nismo stručnjaci u znanstvenim ili medicinskim područjima. Sve objavljene informacije služe isključivo za informativne svrhe.
Molimo vas da informacije s našeg portala ne smatrate potpuno točnima i uvijek se savjetujte s vlastitim liječnikom ili stručnom osobom prije donošenja odluka temeljenih na tim informacijama.
Naš tim se trudi pružiti vam ažurne i relevantne informacije, a sve sadržaje objavljujemo s velikom predanošću.
Pozivamo vas da podijelite svoje priče iz Karlobaga s nama!
Vaše iskustvo i priče o ovom prekrasnom mjestu su dragocjene i željeli bismo ih čuti.
Slobodno nam ih šaljite na adresu karlobag@karlobag.eu.
Vaše priče će doprinijeti bogatoj kulturnoj baštini našeg Karlobaga.
Hvala vam što ćete s nama podijeliti svoje uspomene!