Pasaulis buvo supažindintas su formą keičiančių robotų koncepcija 1991 m., kai T-1000 buvo parodytas kultiniame filme Terminatorius 2: Teismo diena. Nuo tada (jei ne anksčiau) daugelis mokslininkų svajojo sukurti robotą, galintį pakeisti savo formą, kad galėtų atlikti įvairias užduotis.

Ir iš tiesų, pradedame matyti, kaip kai kurie iš šių dalykų atgyja – pvz šis „magnetinis mėšlas“ iš Kinijos Honkongo universitetopavyzdžiui, arba tai skysto metalo Lego vyrasgalintis ištirpti ir susiformuoti iš naujo, kad pabėgtų iš kalėjimo. Tačiau abiem iš jų reikia išorinių magnetinių valdiklių. Jie negali judėti savarankiškai.

Tačiau MIT tyrimų grupė dirba kurdama tokius, kurie gali. Jie sukūrė mašininio mokymosi techniką, kuri apmoko ir valdo perkonfigūruojamą „glebų“ robotą, kuris susigniaužia, lenkia ir pailgėja, kad sąveikautų su aplinka ir išoriniais objektais. Nusivylusi pastaba: robotas nėra pagamintas iš skysto metalo.

2 TERMINATORIUS: SPRENDIMO DIENA Klipas – „Pabėgimas iš ligoninės“ (1991)

„Kai žmonės galvoja apie minkštus robotus, jie linkę galvoti apie robotus, kurie yra elastingi, bet grįžta į pradinę formą“, – sakė Boyuanas Chenas iš MIT Kompiuterių mokslo ir dirbtinio intelekto laboratorijos (CSAIL) ir tyrimo bendraautoris. mokslininkų darbai. „Mūsų robotas yra tarsi gleivės ir iš tikrųjų gali pakeisti savo morfologiją. Labai stebina, kad mūsų metodas taip gerai veikė, nes susiduriame su kažkuo labai nauju.

Tyrėjai turėjo sukurti būdą, kaip valdyti gleivių robotą, kuris neturi rankų, kojų ar pirštai – arba, tiesą sakant, bet koks skeletas, skirtas jo raumenims stumti ir traukti, arba, tiesą sakant, bet kokia nustatyta vieta bet kuriai jo raumenų pavarai. Forma tokia beformė, o sistema tokia be galo dinamiška… Tai košmariškas scenarijus: kaip tu turi užprogramuoti tokius roboto judesius?

Akivaizdu, kad bet kokia standartinė valdymo schema šiame scenarijuje būtų nenaudinga, todėl komanda kreipėsi į AI, išnaudodama savo didžiulę galimybę tvarkyti sudėtingus duomenis. Ir jie sukūrė valdymo algoritmą, kuris išmoksta judėti, ištempti ir formuoti minėtą dėmėtą robotą, kartais kelis kartus, kad atliktų tam tikrą užduotį.

Be nuolatinių „skeleto“ ar pavarų vietų, gleivių robotai yra itin lankstūs, tačiau taip pat yra neįtikėtinas iššūkis valdymo sistemoms.
Be nuolatinių „skeleto“ ar pavarų vietų, gleivių robotai yra itin lankstūs, tačiau taip pat yra neįtikėtinas iššūkis valdymo sistemoms.

MIT

Sustiprinimo mokymasis yra mašininio mokymosi technika, kuri moko programinę įrangą priimti sprendimus naudojant bandymus ir klaidas. Tai puikiai tinka treniruojant robotus su tiksliai apibrėžtomis judančiomis dalimis, pvz., griebtuvą su „pirštais“, kurie gali būti apdovanoti už veiksmus, kurie priartina jį prie tikslo, pavyzdžiui, kiaušinio paėmimą. Bet kaip beformis minkštas robotas kurį valdo magnetiniai laukai?

„Toks robotas gali turėti tūkstančius mažų raumenų gabalėlių, kuriuos reikia valdyti“, – sakė Chenas. „Taigi labai sunku mokytis tradiciniu būdu.”

Norint pasiekti funkcionalų ir efektyvų formos pakeitimą, gleivių robotui reikia vienu metu perkelti didelius jo gabalus; manipuliavimas atskiromis dalelėmis nesukeltų būtinų esminių pokyčių. Taigi tyrėjai netradiciniu būdu naudojo sustiprinimo mokymąsi.

2D veiksmų erdvė, kurioje gretimi veiksmo taškai turi stipresnę koreliaciją, sukuria minkštojo roboto formos pasikeitimą
2D veiksmų erdvė, kurioje gretimi veiksmo taškai turi stipresnę koreliaciją, sukuria minkštojo roboto formos pasikeitimą

Huang ir kt.

Pastiprinimo mokymosi metu visų galiojančių veiksmų arba pasirinkimų rinkinys, prieinamas agentui sąveikaujant su aplinka, vadinamas „veiksmo erdve“. Čia roboto veiksmų erdvė buvo traktuojama kaip vaizdas, sudarytas iš pikselių. Jų modelis naudojo roboto aplinkos vaizdus, ​​​​kad sukurtų 2D veiksmų erdvę, padengtą tinkleliu perdengtais taškais.

Lygiai taip pat, kaip artimi vaizdo pikseliai yra susiję, tyrėjų algoritmas suprato, kad šalia esantys veiksmo taškai turi stipresnę koreliaciją. Taigi, veiksmų taškai aplink roboto „ranką“ judės kartu, kai jis pakeis formą; veiksmo taškai ant „kojos“ taip pat judės kartu, bet kitaip nei rankos judesiai.

Tyrėjai taip pat sukūrė algoritmą su „apytiksliu politikos mokymusi“. Pirma, algoritmas apmokomas naudojant mažos skiriamosios gebos grubią politiką, ty perkeliant didelius gabalus, siekiant ištirti veiksmų erdvę ir nustatyti prasmingus veiksmų modelius. Tada didesnės raiškos, tiksli politika gilinasi, kad optimizuotų roboto veiksmus ir pagerintų jo gebėjimą atlikti sudėtingas užduotis.

Komanda sukūrė užduotimis pagrįstą, į tikslą orientuotą valdymo sistemą, naudodama dirbtinio intelekto sustiprinimo sistemą
Komanda sukūrė užduotimis pagrįstą, į tikslą orientuotą valdymo sistemą, naudodama dirbtinio intelekto sustiprinimo sistemą

MIT

„Nuo stambios iki smulkios vertės reiškia, kad kai imasi atsitiktinio veiksmo, tas atsitiktinis veiksmas gali turėti įtakos“, – sakė Vincentas Sitzmannas, tyrimo bendraautorius, taip pat iš CSAIL. „Rezultatų pokytis greičiausiai bus labai reikšmingas, nes tuo pačiu metu grubiai valdote kelis raumenis.

Kitas buvo išbandyti jų požiūrį. Jie sukūrė modeliavimo aplinką DittoGym, kurioje yra aštuonios užduotys, įvertinančios perkonfigūruojamo roboto gebėjimą keisti formą. Pavyzdžiui, leisti robotui suderinti raidę ar simbolį ir priversti jį augti, kasti, spardyti, gaudyti ir bėgti.

MIT gleivių roboto valdymo schema: pavyzdžiai

„Mūsų užduočių pasirinkimas DittoGym vadovaujasi bendraisiais sustiprinimo mokymosi etalono projektavimo principais ir specifiniais perkonfigūruojamų robotų poreikiais“, – sakė Suningas Huangas iš Tsinghua universiteto (Kinija) Automatikos katedros, kviestinis MIT tyrėjas ir tyrimo bendraautoris.

„Kiekviena užduotis yra skirta tam tikroms savybėms, kurias laikome svarbiomis, pavyzdžiui, gebėjimą naršyti ilgo horizonto tyrinėjimuose, gebėjimą analizuoti aplinką ir sąveikauti su išoriniais objektais“, – tęsė Huangas. „Manome, kad jie kartu gali duoti vartotojai visapusiškai supranta perkonfigūruojamų robotų lankstumą ir mūsų sustiprinimo mokymosi schemos efektyvumą.

DittoGym

Tyrėjai nustatė, kad efektyvumo požiūriu jų algoritmas nuo grubaus iki smulkaus nuosekliai pralenkė alternatyvas (pvz., tik grubią arba tikslią nuo nulio politiką) nuosekliai atliekant visas užduotis.

Praeis šiek tiek laiko, kol išvysime formą keičiančius robotus už laboratorijos ribų, tačiau šis darbas yra žingsnis teisinga kryptimi. Tyrėjai tikisi, kad tai įkvėps kitus sukurti savo perkonfigūruojamą minkštą robotą, kuris vieną dieną galėtų kirsti žmogaus kūną arba būti įtrauktas į nešiojamą įrenginį.

Tyrimas buvo paskelbtas išankstinio spausdinimo svetainėje arXiv.

Šaltinis: MIT





Source link

By admin

Parašykite komentarą

El. pašto adresas nebus skelbiamas. Būtini laukeliai pažymėti *