In vitro neurons learn and exhibit sentience when embodied in a simulated game-world
Макаку играющую в майндпонг через нейралинк видели многие. А представьте себе, если это будут просто нейроны? Согласно нашумевшей теории свободной энергии (Free Energy Principle theory) живые системы “подруливают” в хаотичном потоке событий окружающего мира ориентируясь на один сложный параметр – свободную энергию. Максимально упрощенно, это разница между ожиданием и реальностью. Как метко сказал Анил Сет “мы предсказываем себя в бытие” (we predict ourselves into existence).
Нервные системы не только отслеживают окружающий мир, они еще создают модели мира и модель самого организма. С учетом того, что запоздалая реакция может стоить жизни, то приходится работать на опережение и не просто реагировать, но ПРОГНОЗИРОВАТЬ. Наш мозг непрерывно строит внутреннюю модель мира, на ее основании делает прогнозы о том, что должно произойти, сравнивает прогнозы с поступившей из мира информацией, корректирует картину мира, корректирует прогнозы, цикл замыкается.
Исследователи взяли кортикальные нейроны мышиных эмбрионов и параллельно человеческие индуцированные плюрипотентные клетки, из которых вырастили нейроны. Потом каждой группой колонизировали мультиэлектродные матрицы высокой плотности (high-density multielectrode arrays), дали им прижиться, освоиться и самоорганизоваться в биологическую нейросеть (biological neural network).
Техническая жемчужина эксперимента – система, получившая название DishBrain. Она может использовать свойство нейронов общаться “языком” электрической активности для связи кремниевых и биологических систем посредством электрофизиологической стимуляции и записи. Электроды кремниевого чипа, на котором обустроились нейронные культуры, могут регистрировать электрическую активность в культуре нейронов и обеспечивать “сенсорную” (неинвазивную) электрическую стимуляцию, сравнимую с генерацией потенциалов действия самих нейронов. То есть она записывает условную “болтовню” нейронов, а в ответ на том же “языке” создает им входящий сигнал от окружающей среды.
DishBrain не просто принимает сигналы от нейронов и создает им внешний фон, но с помощью софта симулирует виртуальную реальность пинг-понга. На чипе есть “сенсорная” площадка, на которую транслируется закодированная в электрических стимулах виртуальная реальность с положением “плашек” и мячика, и есть “моторная” с которой считывается активность нейронов и преобразуется в положение плашки в виртуальной реальности.
Как это работает? Смотрим на схему.
Внешние состояния (external states) – это положение плашки и шарика в виртуальной реальности. Они превращаются в сенсорные состояния нейронов (sensory states) – воспринимаемый ими закодированный сигнал. Общаясь между собой сенсорные и моторные нейроны культуры создают условную репрезентацию окружающего мира, а активные состояния (active states) – это их “ответ”, моторные события, которые считываются чипом, обрабатываются софтом, изменяют положение плашки, кодируются и снова транслируются нейронам замыкая цепь обратной связи.
Так вот в эксперименте не просто сравнили, как будут вести себя мышиные и человеческие нейроны. И те и другие разделили еще на несколько групп, одну из которых обучали давая фидбэк, а другие просто вели себя как заблагорассудится.
И нейроны, которые обучались получая обратную связь, чаще попадали по мячику.
Интересно тут то, каким образом происходило их обучение. И мы возвращаемся к самому началу – где же тут принцип свободной энергии и минимизация неопределенности? Если плашка оказывалась в нужном месте отбивая шарик – нейроны получали предсказуемый (predictable) фидбэк (ага, угадали, модель верна), если мимо – непредсказуемый (модель не соответствует реальности). Цепь обратной связи была устроена таким образом, чтобы предсказуемость сигнала была тем выше, чем ближе плашка к отбиванию мячика. А нейроны работая сообща сенсорной и моторной группой минимизировали эту “меру неопределенности” как могли.
P.S. Больше про свободную энергию и прогностическую обработку (predictive coding) можно прочитать в моём лонгриде.