Uverejnené - Vložiť komentár

EgoMimic: Doktorand z Georgia Tech používa výskumné okuliare Project Aria na pomoc pri výcviku humanoidných robotov

Dnes upozorňujeme na nový výskum Georgia Tech ktorý pomáha trénovať roboty na vykonávanie základných každodenných úloh pomocou egocentrických záznamov od používateľov zariadenia Meta Projekt Aria výskumné okuliare. Pozrite si video nižšie, prečítajte si celý príbeh alebo požiadajte o svoju vlastnú výskumnú súpravu Project Aria.

Predstavte si, že by vám v domácnosti pomáhali s každodennými úlohami, ako je pranie bielizne, umývanie riadu a opravy. Na pomoc pri týchto úlohách už používame nástroje, ako sú práčky, umývačky riadu a elektrické vŕtačky. Ale čo keby ste mohli mať ešte výkonnejší a flexibilnejší nástroj v podobe humanoidného robota, ktorý by sa od vás mohol učiť a urýchliť akýkoľvek počet fyzických projektov na vašom zozname úloh?

Aj keby ste mali k dispozícii hardvérový systém, naučiť robota vykonávať každodenné úlohy sa dá len pomalou a neohrabanou metódou zberu údajov, ktorá sa nazýva teleoperácia robota. Až doteraz. Pomocou Výskumná súprava projektu Aria, profesor Danfei Xu a Laboratórium robotického učenia a uvažovania na adrese Georgia Tech používajú egocentrické senzory na okuliaroch Aria na vytváranie tzv. "ľudských údajov" pre úlohy, ktoré má humanoidný robot kopírovať. Pomocou ľudských údajov výrazne znižujú množstvo údajov o teleoperácii robota potrebných na trénovanie politiky robota - prelom, vďaka ktorému by humanoidné roboty mohli byť jedného dňa schopné naučiť sa akýkoľvek počet úloh, ktoré by mohol predviesť človek.

Kareer teleoperuje s robotom, aby získal údaje o tréningu pre EgoMimic. Teleoperácia môže byť náročná na škálovanie a vyžaduje si značné ľudské úsilie.

"Zber údajov pre robotiku tradične znamená vytváranie demonštračných údajov," hovorí Simar Kareer, doktorand na Georgia Tech Škola interaktívnej výpočtovej techniky. "Pomocou ovládača ovládate kĺby robota, aby sa pohyboval a dosiahol požadovanú úlohu, a to stokrát, pričom zaznamenávate údaje zo senzorov, a potom trénujete svoje modely. Je to pomalé a náročné. Jediný spôsob, ako prelomiť tento cyklus, je oddeliť zber údajov od samotného robota."

V súčasnosti sa modely politiky robotov trénujú pomocou veľkého množstva cielených demonštračných údajov špecifických pre každú úzku úlohu s vysokými nákladmi. Kareer predpokladá, že pasívne zozbierané údaje od mnohých výskumníkov, ako sú údaje zachytené okuliarmi Aria, by sa namiesto toho mohli použiť na umožnenie tvorby údajov pre oveľa širší súbor úloh, aby sa v budúcnosti vytvorili všeobecne užitočnejšie roboty.

Inšpirované Projekt Aria a Ego-Exo4D ktorý obsahuje obrovský súbor egocentrických údajov s viac ako 3 000 hodinami videozáznamov každodenných činností, Kareer vyvinul EgoMimic, nový algoritmický rámec, ktorý využíva ľudské údaje a údaje o robotoch na vývoj humanoidných robotov.

"Keď som sa pozrel na Ego4D, videl som súbor údajov, ktorý je rovnaký ako všetky veľké súbory údajov o robotoch, ktoré sa snažíme zhromažďovať, až na to, že ide o údaje o ľuďoch," vysvetľuje Kareer. "Jednoducho si nasadíte okuliare a idete robiť veci. Nemusí to pochádzať od robota. Mala by pochádzať od niečoho škálovateľnejšieho a pasívne generovaného, čo sme my." V Kareerovom výskume sa okuliare Aria použili na vytvorenie ľudských údajov na spolutrénovanie rámca EgoMimic.

Kareer vytvára údaje o spolu-tréningu človeka nahrávaním pomocou okuliarov Aria počas skladania trička.

Okuliare Aria sa vo výskume Georgia Tech nepoužívajú len na zber údajov o ľuďoch. Používajú sa aj ako neoddeliteľná súčasť nastavenia prevádzky robota v reálnom čase. Okuliare Aria sú namontované na ich humanoidnú robotickú platformu rovnako ako pár očí a slúžia ako integrovaný balík senzorov, ktorý umožňuje robotovi vnímať svoje prostredie v reálnom čase. Súprava Aria Client SDK sa využíva na streamovanie údajov zo senzorov Aria priamo do politiky robota, ktorá beží na pripojenom počítači, ktorý následne riadi ovládanie robota. Použitie okuliarov Aria na zber údajov aj na pipeline vnímania v reálnom čase minimalizuje doménovú priepasť medzi ľudským demonštrátorom a robotom, čím sa otvára cesta pre škálované generovanie ľudských údajov pre budúce školenia robotických úloh.

Okuliare Aria pripevnené na hornej časti robota poskytujú systému údaje zo senzorov, ktoré umožňujú robotovi vnímať priestor a komunikovať s ním.

Vďaka systému EgoMimic dosiahol Kareer zvýšenie výkonu svojho robota o 400% v rôznych úlohách v porovnaní s predchádzajúcimi metódami len s 90 minútami nahrávok Aria. Robot dokázal tieto úlohy úspešne vykonávať aj v predtým nevídaných prostrediach.

V budúcnosti by sa humanoidné roboty mohli trénovať vo veľkom meradle pomocou egocentrických údajov, aby mohli vykonávať rôzne úlohy rovnakým spôsobom ako ľudia.

"Na spoločnosť Aria sa pozeráme ako na investíciu do výskumnej komunity," hovorí James Fort, produktový manažér pre výskum v spoločnosti Meta Reality Labs. "Čím viac sa egocentrická výskumná komunita štandardizuje, tým viac výskumníkov bude môcť spolupracovať. Práve vďaka takémuto škálovaniu s komunitou môžeme začať riešiť väčšie problémy týkajúce sa toho, ako budú veci fungovať v budúcnosti."

Kareer prednesie svoj príspevok o EgoMimicu na konferencii 2025 Medzinárodná konferencia inžinierov IEEE o robotike a automatizácii (ICRA) v Atlante.

Uverejnené - Vložiť komentár

Predstavujeme Aria Gen 2: odomknutie nového výskumu v oblasti strojového vnímania, kontextovej umelej inteligencie, robotiky a ďalších

Od svojho uvedenia na trh v roku 2020, Projekt Aria umožnila výskumníkom na celom svete pokročiť v oblasti strojového vnímania a umelej inteligencie vďaka prístupu k špičkovému výskumnému hardvéru a otvoreným zdrojovým kódom. súbory údajov, modely a nástroje. Dnes s radosťou oznamujeme ďalší krok na tejto ceste: uvedenie okuliarov Aria Gen 2. Táto nová generácia hardvéru odomkne nové možnosti v širokej škále oblastí výskumu vrátane strojového vnímania, egocentrickej a kontextovej umelej inteligencie a robotiky.

0:00 / 0:00

Pre výskumníkov, ktorí chcú preskúmať, ako môžu systémy AI lepšie pochopiť svet z ľudskej perspektívy., okuliare Aria Gen 2 prinášajú do platformy Aria nový súbor funkcií. Zahŕňajú množstvo pokrokov, ktoré sa nenachádzajú v žiadnom inom dnes dostupnom zariadení, a prístup k týmto prelomovým technológiám umožní výskumníkom posunúť hranice možností.

V porovnaní so systémom Aria Gen 1 zahŕňa jedinečná ponuka hodnoty systému Aria Gen 2:

  • Najmodernejší súbor senzorov: Vylepšená sada senzorov obsahuje kameru RGB, kamery SLAM 6DOF, kamery na sledovanie očí, priestorové mikrofóny, IMU, barometer, magnetometer a GNSS. V porovnaní s predchodcom Aria Gen 1 zavádza nová generácia dva inovatívne snímače zabudované v nosovej podložke: PPG snímač na meranie srdcovej frekvencie a kontaktný mikrofón na rozlíšenie hlasu používateľa od hlasu okolostojacich osôb.
  • Mimoriadne nízka spotreba energie a vnímanie strojov v zariadení: SLAM, sledovanie očí, sledovanie rúk a rozpoznávanie reči sa spracúvajú priamo v zariadení pomocou vlastného kremíka spoločnosti Meta.
  • Celodenná použiteľnosť: Okuliare Aria Gen 2 vydržia šesť až osem hodín nepretržitého používania, vážia približne 75 gramov a majú skladacie ramienka na jednoduché prenášanie.
  • Interakcia prostredníctvom zvuku: Používatelia získavajú zvukovú spätnú väzbu prostredníctvom najlepších reproduktorov s potlačením sily v otvorených ušiach vo svojej triede, čo umožňuje vytváranie prototypov systému priamo u používateľa.

Naša stránka desaťročie trvajúca cesta na vytvorenie ďalšej počítačovej platformy viedlo k vývoju týchto kritických technológií. V spoločnosti Meta ich budú tímy Reality Labs Research a laboratória FAIR AI využívať na podporu našej dlhodobej výskumnej vízie.. Ich sprístupnenie akademickým a komerčným výskumným laboratóriám prostredníctvom projektu Aria prispeje k ďalšiemu pokroku v otvorenom výskume a verejnému pochopeniu kľúčového súboru technológií, ktoré podľa nášho názoru pomôžu formovať budúcnosť výpočtovej techniky a umelej inteligencie.

Otvorený výskum, ktorý projekt Aria umožňuje od roku 2020, už viedol k dôležitej práci vrátane vytvorenia nástrojov s otvoreným zdrojovým kódom, ktoré sa široko používajú v akademickom a priemyselnom prostredí. Na stránke . Súbor údajov Ego-Exo4Dzhromaždené pomocou prvej generácie okuliarov Aria, sa stali základným nástrojom moderného počítačového videnia a rastúcej oblasti robotiky. Výskumníci z Georgia Tech nedávno ukázali, ako môže výskumná súprava Aria pomôcť humanoidným robotom naučiť sa pomáhať ľuďom v domácnosti., zatiaľ čo tímy v BMW použil na preskúmanie možností integrácie systémov rozšírenej a virtuálnej reality do inteligentných vozidiel.

Aria tiež umožňuje vývoj nových technológií pre prístupnosť. Prvú generáciu okuliarov Aria využili Carnegie Mellon University v ich projekte NavCog, ktorého cieľom bolo vytvoriť technológie na pomoc nevidiacim a slabozrakým osobám pri navigácii vo vnútri budov. Na tomto základe teraz okuliare Aria Gen 2 využívajú Envision, spoločnosť zameraná na vytváranie riešení pre nevidiacich alebo slabozrakých ľudí. Spoločnosť Envision skúma možnosti integrácie svojich Ally Asistent s umelou inteligenciou a priestorový zvuk pomocou najnovších okuliarov Aria Gen 2 na zlepšenie navigácie v interiéri a prístupnosti.

0:00 / 0:00

Spoločnosť Envision využila možnosti SLAM v zariadení Aria Gen 2 spolu s funkciami priestorového zvuku prostredníctvom zabudovaných reproduktorov, aby pomohla nevidiacim a slabozrakým osobám bezproblémovo sa orientovať vo vnútornom prostredí. Toto inovatívne využitie technológií, ktoré je zatiaľ v prieskumnej a výskumnej fáze, je príkladom toho, ako môžu výskumníci využiť okuliare Aria Gen 2 na prototypovanie zážitkov s umelou inteligenciou na základe egocentrického pozorovania. Vďaka pokročilým senzorom a možnostiam strojového vnímania na zariadení vrátane SLAM, sledovania očí, sledovania rúk a zvukových interakcií sú tiež ideálne na zber údajov pre výskumné a robotické aplikácie.

V nasledujúcich mesiacoch sa s partnermi podelíme o ďalšie podrobnosti o termíne dostupnosti zariadenia. Výskumníci, ktorí majú záujem o prístup k zariadeniu Aria Gen 2, môžu prihláste sa na odber aktualizácií. Tešíme sa na to, ako výskumníci využijú Aria Gen 2, aby pripravili pôdu pre budúce inovácie, ktoré budú formovať ďalšiu počítačovú platformu.

Uverejnené - Vložiť komentár

Vnútri zariadenia Aria Gen 2: preskúmajte najmodernejšiu technológiu, ktorá stojí za zariadením

Začiatkom tohto roka sme oznámil naše najnovšie výskumné okuliare Aria Gen 2, ktoré sú pokračovaním poslania projektu Aria umožniť výskumníkom na celom svete rozvíjať najnovšie poznatky v oblasti strojového vnímania, kontextovej umelej inteligencie a robotiky prostredníctvom prístupu k špičkovému výskumnému hardvéru a súborom údajov, modelov a nástrojov s otvoreným zdrojovým kódom. Dnes sa s vami radi podelíme o ďalšie informácie o technológiách vo vnútri zariadenia Aria Gen 2. Patrí sem podrobný prehľad o tvarovom faktore, zvukových schopnostiach, výdrži batérie, vylepšených kamerách a senzoroch, výpočtoch v zariadení a ďalšie informácie.

Čo je Aria Gen 2?

Aria Gen 2 je nositeľné zariadenie, ktoré spája najnovšie pokroky v oblasti počítačového videnia, strojového učenia a technológie senzorov. Kompaktné rozmery a ľahká konštrukcia zariadenia Aria Gen 2 z neho robia ideálnu voľbu pre výskumníkov, ktorí potrebujú zbierať údaje alebo vytvárať prototypy v rôznych prostrediach. Okuliare obsahujú množstvo vylepšení v porovnaní s Aria Gen 1, jeho výskumného predchodcu, ktorý bol oznámený už v roku 2020.

Aria Gen 2: Pokroky a funkcie

Prechod z modelu Aria Gen 1 na Gen 2 predstavuje významný skok v oblasti nositeľných technológií a ponúka rozšírené funkcie a možnosti, ktoré vyhovujú širšiemu spektru aplikácií a potrieb používateľov. Nižšie skúmame kľúčové rozdiely a vylepšenia zavedené v zariadení Aria Gen 2.

1. Nositeľnosť

Aria Gen 2 sa môže pochváliť vynikajúcou nositeľnosťou, ktorá sa vyznačuje zvýšeným komfortom a prispôsobením, pričom sa prispôsobuje širšiemu rozsahu morfológie tváre a bohatej sade snímačov pre výskum. Okuliare si zachovávajú ľahkú konštrukciu (vážia 74 - 76 g v závislosti od veľkosti) a teraz obsahujú skladacie ramená na jednoduchšie skladovanie a prepravu pri každodennom používaní. Aby sme každému používateľovi zabezpečili optimálne fyzické a funkčné prispôsobenie, zaviedli sme osem veľkostných variantov zariadenia - zohľadňujúc množstvo ľudských faktorov vrátane šírky hlavy a odchýlok nosného mostíka.

Osem veľkostných variantov našich zariadení Aria Gen 2.

2. Vylepšenia kamery pre počítačové videnie (CV)

Vysoký dynamický rozsah (HDR): Snímač kamery Aria Gen 2 s globálnou uzávierkou ponúka vysoký dynamický rozsah 120 dB v porovnaní s rozsahom 70 dB v kamere Gen 1. Umožňuje to vynikajúce úlohy počítačového videnia v rôznych svetelných podmienkach.

0:00 / 0:00

Video ilustruje, že kamera CV dokáže zachytiť veľmi dynamické scény s vláknom LED svetla, ktoré je rozlíšené spolu s ostatnými detailmi scény.

Široké zorné pole (FOV): Zariadenie Aria Gen 2 je vybavené štyrmi kamerami počítačového videnia (CV), čím sa zdvojnásobil počet kamier CV v zariadení Gen 1. Poskytujú širšie zorné pole a umožňujú pokročilé 3D sledovanie rúk a objektov.

Stereofónne prekrývanie: Stereoprekrytie v Gen 2 sa zvýšilo na 80° z 35° v Gen 1, čo uľahčuje stereofónne modely základov, ktoré zlepšujú vnímanie hĺbky a priestorové povedomie.

0:00 / 0:00

Uvedený príklad ilustruje, ako zvýšené stereo prekrytie umožňuje metódam, ako je FoundationStereo od spoločnosti NVIDIA, generovať mapy hĺbky na základe rektifikovaných stereo obrazov. Mapy hĺbky sa dajú zlúčiť na generovanie geometrických rekonštrukcií scény len pomocou údajov stereopáru Aria Gen 2.

3. Nové integrácie senzorov

Senzor okolitého svetla (ALS): Aria Gen 2 obsahuje kalibrovanú ALS, ktorá umožňuje lepšie algoritmy kontroly expozície a odomyká nové možnosti pri nízkych snímkových frekvenciách. Ultrafialový režim ALS možno použiť na rozlíšenie medzi vnútorným a vonkajším osvetlením, ako ilustruje video.

0:00 / 0:00

Kontaktný mikrofón: Zariadenie Aria Gen 2 obsahuje kontaktný mikrofón zabudovaný v nosovej podložke zariadenia, ktorý zlepšuje snímanie zvuku v hlučnom prostredí.

0:00 / 0:00

Video ukazuje nositeľa vo veternom tuneli, aby sa simuloval veterný scenár, v ktorom kontaktný mikrofón dokáže zachytiť šepot nositeľa, zatiaľ čo akustické mikrofóny to nedokážu.

Tepová frekvencia: Zariadenie Aria Gen 2 obsahuje fotopletyzmografický (PPG) snímač zabudovaný v nosovej podložke zariadenia, ktorý umožňuje odhadnúť srdcovú frekvenciu osoby, ktorá nosí zariadenie.

4. Časové zarovnanie zariadenia

Aria Gen 2 má vstavané hardvérové riešenie, ktoré využíva Sub-GHz rádiovú technológiu na vysielanie časových informácií, čo umožňuje presné časové zladenie s inými zariadeniami Aria Gen 2 alebo kompatibilnými zariadeniami, ktoré podporujú Sub-GHz rádio. Táto technológia dosahuje časové zladenie s presnosťou pod milisekundu, čo predstavuje výrazné zlepšenie v porovnaní s softvérové zarovnanie Gen 1.

0:00 / 0:00

Video ukazuje, ako Aria Gen 2 využíva časové zarovnanie zariadení na úlohy, ako je zápis z distribuovaných snímok z dvoch zariadení Aria Gen 2.

5. Signály strojového vnímania (MP) v reálnom čase na zariadení

Aria Gen 2 obsahuje pokročilé algoritmy strojového vnímania priamo v zariadení, ktoré bežia na energeticky úspornom vlastnom koprocesore Meta. Tieto špičkové funkcie umožňujú zariadeniu generovať presné a precízne údaje, ktoré sledujú našu interakciu s okolím.

Vizuálna inerciálna odometria (VIO)

Jednou z kľúčových funkcií systému Aria Gen 2 je jeho schopnosť sledovať okuliare v šiestich stupňoch voľnosti (6DOF) v rámci priestorového referenčného rámca pomocou vizuálnej inerciálnej odometrie (VIO). To umožňuje bezproblémovú navigáciu a mapovanie prostredia, čím sa otvárajú nové možnosti výskumu v oblasti kontextovej umelej inteligencie a robotiky.

Sledovanie očí

Aria Gen 2 sa môže pochváliť aj pokročilým systémom sledovania očí pomocou kamery, ktorý sleduje pohľad používateľa s bezkonkurenčnou presnosťou. Tento systém poskytuje množstvo informácií vrátane: pohľadu na oko, vergenčného bodu, detekcie žmurkania, odhadu stredu zreničky, priemeru zreničky, stredu rohovky atď.

Tieto pokročilé signály umožňujú hlbšie pochopenie vizuálnej pozornosti a zámerov používateľa, čím sa otvárajú nové možnosti interakcie medzi človekom a počítačom.

Ručné sledovanie

Aria Gen 2 je tiež vybavená riešením na sledovanie ruky, ktoré sleduje ruku používateľa v 3D priestore. To vytvára kĺbové polohy kĺbov rúk v referenčnom rámci zariadenia, čo uľahčuje presné anotácie rúk pre súbory údajov a umožňuje aplikácie, ako je napríklad obratná manipulácia s rukami robotov, ktoré vyžadujú vysokú presnosť.

0:00 / 0:00

Ukážka senzorov a schopností strojového vnímania zariadenia Aria Gen 2, ako aj na nich postavených algoritmov mimo zariadenia.

Budúcnosť spoločnosti Aria je tu: Buďte informovaní

Okuliare Aria Gen 2 pripravujú pôdu pre budúce inovácie, ktoré budú definovať ďalšiu počítačovú platformu. Prihlášky na prácu s Aria Gen 2 sa otvoria ešte tento rok a výskumníci, ktorí majú záujem byť informovaní, sa môžu pripojiť k Zoznam záujmov o Aria Gen 2. Zatiaľ sa stále priebežne prijímajú žiadosti o výskumnú súpravu Aria s okuliarmi Aria Gen 1.Prihláste sa teraz aby ste mohli okamžite začať.

Pridajte sa k nám na CVPR 2025 v Nashville, Tennessee, kde tím predstaví okuliare Aria Gen 2 prostredníctvom interaktívnych ukážok. Navštívte stánok spoločnosti Meta, aby ste si vyskúšali najnovšie pokroky a dozvedeli sa viac o inovatívnych funkciách okuliarov Aria Gen 2.