Роль уваги
Неявною вимогою для глибинних мереж, що використовують метод зворотного поширення, є наявність «вчителя»: того, що може обчислити помилку, допущену мережею нейронів. Але «в мозку немає вчителя, який говорить кожному нейрону у моторній корі:« Ти повинен бути увімкнений, а ти повинен бути вимкнений », – сказав Пітер Роельфсема з Нідерландського інституту нейробіології в Амстердамі.

Роелфсема вважає, що вирішення проблеми мозком знаходиться в процесі уваги. В кінці 1990-х він і його колеги показали, що, коли мавпи фіксують погляд на об’єкті, нейрони, що представляють цей об’єкт в корі головного мозку, стають більш активними. Фокусування уваги мавпи виробляє сигнал зворотного зв’язку для відповідальних нейронів. «Це дуже вибірковий сигнал зворотного зв’язку», – сказав Роелфсема. «Це не сигнал про помилку. Він просто говорить всім цим нейронам: ви будете відповідальні [за дію] ».
Розуміння Роелфсеми полягало в тому, що цей сигнал зворотного зв’язку може сприяти навчанню, що подібне до методу зворотного поширення, в поєднанні з процесами, виявленими в деяких інших нейробіологічних відкриттях. Наприклад, Вольфрам Шульц з Кембриджського університету і інші показали, що коли тварини виконують дію, яка дає кращі результати, ніж очікувалося, активується дофамінова система мозку. «Це наповнює мозок нейронними модуляторами», – сказав Роелфсема. Рівень дофаміну діє як глобальний сигнал підкріплення.
«Теоретично сигнал зворотного зв’язку за увагою може активувати лише ті нейрони, які відповідають за дію у відповідь на глобальний сигнал підкріплення, оновлюючи їх синаптичну вагу», сказав Ролфсема. Він і його колеги використовували цю ідею для створення глибинного (навчання) нейронної мережі і вивчення її математичних властивостей. «Виявляється, ви отримуєте зворотне поширення помилок. По суті, ви отримуєте те ж рівняння », – сказав він. «Але тепер це стало біологічно правдоподібним».
Команда представила цю роботу на онлайн-конференції Neural Information Processing Systems в грудні. «Ми можемо навчати глибинні мережі (машине навчання)», – сказав Рулфсема. «Це всього в два-три рази повільніше, ніж метод зворотного поширення». Таким чином, за його словами, «він перевершує всі інші алгоритми, які були запропоновані як біологічно правдоподібні».
Проте конкретних емпіричних доказів того, що живий мозок використовує ці ймовірні механізми, отримати найближчим часом не вийде. «Я думаю, що нам все ще чогось не вистачає», – сказав Бенжі. «З мого досвіду, це може бути дрібниця, може бути, кілька змін одного з існуючих методів, які дійсно мають значення».
Тим часом у Ямінса і його колег зі Стенфорда є пропозиції, як визначити, яке із запропонованих правил навчання, якщо таке є, є правильним. Проаналізувавши 1056 штучних нейронних мереж, що реалізують різні моделі навчання, вони виявили, що тип правила навчання, яке керує мережею, можна визначити за активністю підмножини нейронів з плином часу. Не виключено, що така інформація могла б бути записана з мозку мавпи. «Виявляється, що якщо у вас є правильний набір спостережуваних, можна придумати досить просту схему, яка дозволить вам визначати правила навчання», – сказав Ямінс.
З огляду на такі досягнення, комп’ютерні нейробіологи налаштовані досить оптимістично. «Є багато різних способів, якими мозок може виконувати зворотне поширення», – сказав Кордінг. «І еволюція до біса крута. Зворотне поширення корисно. Я вважаю, що сама еволюція підводить нас до цього ».