Jako kdyby fosilní průmyslníci varovali před klimatickou změnou
1. 6. 2023 / Jan Rovenský
Ilustrace: Jáchym Bohumil Kartous Zkuste si představit čelné pracovníky fosilního průmyslu, jak v...2. 5. 2023
Tento úspěch překonává základní omezení fMRI, které spočívá v tom, že tato technika sice dokáže mapovat mozkovou aktivitu na konkrétní místo s neuvěřitelně vysokým rozlišením, ale je jí vlastní časová prodleva, která znemožňuje sledování aktivity v reálném čase.
Zpoždění existuje proto, že skeny fMRI měří odezvu krevního toku na mozkovou aktivitu, která dosahuje vrcholu a vrací se do výchozího stavu během přibližně 10 sekund, což znamená, že ani ten nejvýkonnější skener nemůže tuto hodnotu zlepšit. "Je to hlučný, pomalý zástupce nervové aktivity," řekl Huth.
Tento tvrdý limit ztěžuje schopnost interpretovat mozkovou aktivitu v reakci na přirozenou řeč, protože poskytuje "změť informací" rozloženou do několika sekund.
Nástup rozsáhlých jazykových modelů - takových, na kterých je založena umělá inteligence ChatGPT společnosti OpenAI - však poskytl novou cestu. Tyto modely jsou schopny číselně reprezentovat sémantický význam řeči, což vědcům umožnilo sledovat, které vzorce neuronální aktivity odpovídají řetězcům slov s určitým významem, místo aby se pokoušeli číst aktivitu slovo po slově.
Proces učení byl intenzivní: tři dobrovolníci museli ležet ve skeneru po dobu 16 hodin a poslouchat podcasty. Dekodér byl vycvičen k přiřazování mozkové aktivity k významu pomocí velkého jazykového modelu GPT-1, předchůdce modelu ChatGPT.
Později byli stejní účastníci skenováni při poslechu nového příběhu nebo při představě, že vyprávějí příběh, a dekodér byl použit k vygenerování textu pouze z mozkové aktivity. Přibližně v polovině případů se text přesně - a někdy i velmi přesně - shodoval se zamýšleným významem původních slov.
"Náš systém pracuje na úrovni myšlenek, sémantiky, významu," řekl Huth. "To je důvod, proč to, co z něj dostaneme, nejsou přesná slova, ale podstata."
Například když účastníkovi přehrál slova "Ještě nemám řidičský průkaz", dekodér je přeložil jako "Ještě se ani nezačala učit řídit". V jiném případě se hrála slova "Nevěděla jsem, jestli mám křičet, brečet nebo utéct. Místo toho jsem řekla: "Nech mě být!"" byla dekódována jako "Začala křičet a plakat, a pak jen řekla: "Říkala jsem ti, abys mě nechal na pokoji".".
Účastníci byli také požádáni, aby se během pobytu ve skeneru podívali na čtyři krátká, němá videa, a dekodér byl schopen využít jejich mozkovou aktivitu k přesnému popisu části obsahu, uvádí se v článku v časopise Nature Neuroscience.
"Pro neinvazivní metodu je to skutečný skok kupředu ve srovnání s tím, co se dělalo dříve, obvykle jednotlivá slova nebo krátké věty," řekl Huth.
Někdy se dekodér dostal na špatný konec a měl problémy s některými aspekty jazyka, včetně zájmen. "Nevěděl, jestli jde o první nebo třetí osobu, o muže nebo ženu," řekl Huth. "Proč mu to nejde, nevíme."
Dekodér byl personalizovaný, a když byl model testován na jiné osobě, bylo čtení nesrozumitelné. Bylo také možné, aby účastníci, na nichž byl dekodér vycvičen, systém blokovali, například tím, že mysleli na zvířata nebo si v klidu představili jiný příběh.
"Bereme velmi vážně obavy, že by mohl být použit ke špatným účelům, a snažili jsme se tomu zabránit. Chceme se ujistit, že lidé používají tyto typy technologií jen tehdy, když chtějí, a že jim to pomáhá."
Diskuse