Как Первичная Зрительная Кора Вычисляет «Суть» Сцены

Новости науки

Резюме: Ученые обнаружили, что мозг начинает обобщать сложные визуальные сцены гораздо раньше, чем предполагалось. Исследование показало, что первичная зрительная кора (V1), которую традиционно считали ответственной только за обработку простых контуров и линий, на самом деле выполняет «ансамблевое восприятие».

Этот процесс позволяет мозгу игнорировать отдельные движущиеся точки и вместо этого извлекать статистическую «суть» — например, среднее направление движения и уровень «шума» (дисперсии) в сцене. Эти ранние обобщенные данные затем передаются в заднюю теменную кору (ЗТК), где они преобразуются в абстрактные категории для принятия решений.

Ключевые факты

  • Раннее сжатие информации: Первичная зрительная кора (V1) не просто передает необработанные данные; она сжимает сложный входной сигнал в полезные статистические сводки (среднее значение и дисперсию) уже на самом первом этапе кортикальной обработки.
  • Секрет «ненастроенных» нейронов: Исследователи обнаружили, что даже нейроны, которые казались «ненастроенными» (не демонстрировали явных индивидуальных предпочтений), вносили значительный вклад в общий популяционный код, доказывая, что мозг полагается на коллективную нейронную активность.
  • Предвзятость, вызванная задачей: Когда мыши активно выполняли задачу, их представления в V1 становились «предвзятыми» по отношению к изученным категориям, что показывает, как поведенческий контекст может изменять даже самые ранние уровни зрительного восприятия.
  • Иерархия функций: В то время как V1 занимается «математикой» сцены (средние значения и распределения), ЗТК берет на себя «логику», преобразуя эти числа в поведенческие решения, такие как «движение влево» или «движение вправо».

В сложных визуальных средах мозг животных не может позволить себе анализировать каждую деталь по отдельности. Вместо этого он быстро извлекает общую структуру сцены — например, среднее направление движения множества движущихся элементов. Эта способность, известная как ансамблевое восприятие, позволяет мозгу мгновенно уловить «суть» происходящего. Однако до сих пор было неясно, где и как в мозге происходит вычисление этой статистической сводки.

Исследовательская группа под руководством Ли Доюна и Кима Йи-Джуна из Центра памяти и глионауки при Институте фундаментальных наук (IBS) теперь показала, что этот процесс начинается гораздо раньше в зрительной системе, чем предполагалось. Соавтор Ли Доюн отметил: «Особенно поразительно то, что это преобразование начинается уже в первичной зрительной коре. Мозг начинает сжимать сложный сенсорный вход в полезные статистические сводки на очень ранней стадии».

В мозге зрительная информация обрабатывается поэтапно по иерархии областей. Первичная зрительная кора (V1) является первой корковой стадией, которая получает зрительный ввод от глаз и традиционно считается обрабатывающей простые признаки, такие как контуры или направление движения. Далее по цепочке задняя теменная кора (ЗТК) интегрирует эту информацию в более абстрактные представления, связанные с восприятием и принятием решений. Исследователи обнаружили, что V1 уже кодирует не только среднее направление сложных паттернов движения, но и их дисперсию — насколько рассеянным или неопределенным является движение. Эта информация затем передается в ЗТК, где она реорганизуется в более абстрактные категориальные представления, которые могут направлять поведение.

Чтобы исследовать, как мозг извлекает эти визуальные сводки, команда обучила мышей с фиксированной головой классифицировать стимулы движения случайных точек в соответствии с их общим направлением. В отличие от обычных дисплеев движения, где многие точки движутся согласованно в одном направлении, стимулы в этом исследовании были разработаны таким образом, что каждая точка двигалась в разном направлении, выбранном из контролируемого распределения. Это позволило исследователям независимо манипулировать средним направлением движения и его изменчивостью. Мыши успешно научились группировать восемь возможных средних направлений движения в две категории. Даже когда движение отдельных точек сильно варьировалось, животные все еще могли классифицировать общее направление, указывая, что они не просто следовали за несколькими заметными локальными сигналами. Вместо этого они извлекали истинную статистическую сводку сцены. «Мы показали, что мозг не обрабатывает сложный визуальный ввод, отслеживая каждый элемент индивидуально, — сказал Ли Ён-Бом, первый автор исследования. — Вместо этого он извлекает стабильную сводную информацию, такую как среднее значение и дисперсия, чтобы быстро уловить общую структуру окружающей среды».

Используя минископическую кальциевую визуализацию, исследователи записывали нейронную активность как в V1, так и в ЗТК, пока мыши выполняли задачу или пассивно просматривали стимулы. На уровне отдельных нейронов лишь относительно небольшое подмножество демонстрировало явную избирательность к глобальному среднему направлению движения. Однако на популяционном уровне нейронная активность в обеих областях надежно кодировала среднее направление движения — даже при том, что большинство отдельных нейронов сами по себе не казались сильно настроенными.

Исследование выявило четкое разделение труда по всей корковой иерархии. В V1 активность популяции кодировала как среднее значение, так и дисперсию направления движения, что указывает на то, что ранняя зрительная кора уже вычисляет сводные статистические данные, а не просто передает локальные сигналы. В ЗТК же представление смещалось к более абстрактной, релевантной для задачи категориальной информации, предполагая, что сенсорные сводки постепенно преобразуются в сигналы, необходимые для выполнения задачи.

Исследователи также обнаружили, что требования задачи могут изменять ранние зрительные представления. Во время активной категоризации нейронное представление среднего направления движения в V1 систематически смещалось к центру изученной категории. Это говорит о том, что даже ранняя зрительная кора не является чисто стимул-зависимой, а может находиться под влиянием обучения и поведенческого контекста.

Еще одним примечательным открытием стало то, что кажущиеся «ненастроенными» нейроны все же вносили существенный вклад в популяционный код. Даже нейроны, которые не соответствовали традиционным критериям избирательности, помогали поддерживать точное представление глобального направления движения при коллективном анализе, подчеркивая важность распределенного популяционного кодирования в мозге.

Соавтор Ким Йи-Джун добавил: «Наши результаты показывают, что визуальная информация постепенно реорганизуется — от сводной статистики в ранней зрительной коре до более абстрактных категориальных представлений в более высоких корковых областях. Это дает важную подсказку о том, как мозг эффективно осмысливает сложные сцены». Раскрывая, как мозг преобразует шумный сенсорный ввод в стабильные статистические сводки, а затем в абстрактные категориальные сигналы, исследование предоставляет новое понимание фундаментального принципа восприятия. Эти выводы могут помочь объяснить, как мозг быстро извлекает значимую структуру из сложных сред, а также могут быть полезны для будущих работ в области искусственного интеллекта и компьютерного зрения.

Ответы на ключевые вопросы:

В: Отслеживает ли мой мозг каждую отдельную пчелу, когда я смотрю на рой?

О: Нет, это вызвало бы полную перегрузку системы. Это исследование показывает, что ваш мозг (начиная с самой первой корковой области) вычисляет «среднее» направление роя и насколько «беспорядочно» движение. Он рассматривает рой как один статистический объект, а не как тысячу отдельных.

В: Что такое «ненастроенный» нейрон, и почему это важно?

О: Ученые раньше игнорировали нейроны, которые не «срабатывали» сильно на определенное направление. Однако это исследование доказывает, что эти «тихие» нейроны подобны бэк-вокалистам в хоре — по отдельности вы можете их не слышать, но коллективно они делают «песню» (визуальное представление) гораздо более ясной и точной.

В: Может ли это исследование помочь улучшить ИИ?

О: Безусловно. Современный ИИ часто сталкивается с «шумом» в сложных средах. Имитируя то, как человеческий мозг использует раннее статистическое сжатие для упрощения данных, инженеры могли бы создавать системы компьютерного зрения, которые были бы намного быстрее и эффективнее в навигации по реальному миру.

Антон Беркутов
Антон Беркутов

Антон Беркутов - журналист из Нижнего Новгорода с 12-летним опытом работы в сфере экономической аналитики и расследований киберпреступлений. Регулярно публикуется в федеральных изданиях, специализируется на разоблачении финансовых пирамид и криптовалютных афер.

Обзор последних событий в мире шоу-бизнеса