Андрей Ленский

За экраном чисел: путешествие в мир нейронных сетей


Скачать книгу

      Представьте себе простую ситуацию. Вы фотографируете своего пса – лохматого, с влажным носом и взглядом, который растопил бы любое сердце. Загружаете снимок в приложение, и через мгновение оно сообщает: "Это золотистый ретривер!" Вы улыбаетесь, удивляясь, как ловко техника распознала породу. А что происходит внутри? Нейронная сеть берет ваше фото и разбивает его на миллионы крошечных кусочков – пикселей. Каждый пиксель превращается в число: яркость, цвет, оттенок. Затем эти числа проходят через тысячи маленьких "калькуляторов", которые сравнивают их с тем, что сеть уже видела раньше – миллионами изображений собак, кошек, хомяков и даже случайных предметов вроде тапочек. В итоге она выдает вердикт: "Ретривер". Но вот что поразительно: для сети ваш пес – не верный друг, а лишь набор цифр. Никаких эмоций, только строгий и беспристрастный расчет.

      Кажется, что это похоже на сухую бухгалтерию? Вовсе нет. За этими цифрами скрывается история, которая началась более 80 лет назад и до сих пор полна загадок. В 2011 году, например, ученые из Google провели необычный эксперимент. Они загрузили в нейронную сеть миллионы случайных видео с YouTube и дали ей задание: "Ищите, что угодно". Никто не подсказывал, на что обращать внимание, – сеть осталась один на один с хаосом данных. И что же произошло? Через несколько дней она объявила: "Я нашла кошек!" Это был первый случай, когда машина самостоятельно "поняла", что такое кот, без малейшей помощи человека. Исследователи были ошеломлены. Этот момент стал поворотным: нейронные сети доказали, что способны находить смысл там, где мы видим лишь беспорядок, – и все это благодаря математике, а не чарам.

      Но давайте заглянем чуть глубже. Возможно, вы слышали, что нейронные сети – это "копия человеческого мозга". В рекламах часто показывают красивые схемы: нейроны, связи, искры гениальности. На деле все не совсем так. В человеческом мозге – 86 миллиардов живых нейронов, которые обмениваются сигналами, словно огромная сеть знакомых, перешептывающихся на вечеринке. А искусственные сети? Это всего лишь уравнения, созданные людьми, чтобы имитировать эту сложную беседу. Самое простое из них выглядит так: y=wx+b. Здесь x – входные данные (например, яркость пикселя с уха вашего пса), w – вес, определяющий важность этого элемента, а b – небольшая корректировка, чтобы результат не ушел в бесконечность. Объедините миллионы таких уравнений, настройте их, и они начнут предсказывать мир вокруг вас. Это не мозг, а его математический двойник – хитроумный, но лишенный души.

      Интересно, что сети не всегда считались такими мощными. В 1980-х годах их называли бесполезной затеей. Первая попытка создать нечто подобное – машина под названием Перцептрон – могла различать букву "А" от "Б", но стоило показать ей перевернутый треугольник, и она терялась, как новичок в лабиринте. Ученые разочарованно пожимали плечами: "Это игрушка, а не технология будущего". В 1969 году известный математик Марвин Мински даже написал книгу, доказывая, что сети никогда не справятся с серьезными задачами. После этого о них забыли почти на 15 лет. Но затем появились новые идеи, усовершенствованные формулы и немного упорства. Сегодня сети не только распознают треугольники – они сочиняют музыку, диагностируют болезни и даже предсказывают, закажете ли вы пиццу в пятницу вечером.

      А теперь несколько фактов, о которых редко упоминают. Во-первых, сети порой ошибаются так нелепо, что это почти комично. В 2015 году ученые обнаружили, что, добавив пару незаметных точек на изображение, можно заставить сеть принять собаку за танк или черепаху за ружье. Представьте: вы показываете фото своего ретривера, а она выдает: "Это бронетехника!" Это не ошибка в привычном смысле, а особенность – сети смотрят на мир через свои странные цифровые линзы, и иногда эти линзы искажают реальность. Во-вторых, обучение одной сети требует колоссальных ресурсов. В 2019 году подсчитали, что тренировка крупной модели выделяет столько углекислого газа, сколько пять автомобилей за всю свою жизнь. Так что, пока вы читаете эти строки, где-то в дата-центре сеть "размышляет" и заодно нагревает планету.

      Но есть и вдохновляющие примеры. В 2020 году сеть под названием GPT-3 написала статью для газеты – с примерами, шутками и даже моралью. Читатели не могли поверить, что это не работа человека. А в 2023 году другая сеть создала короткометражный фильм: придумала сценарий, озвучила персонажей и нарисовала кадры. И это лишь начало. Нейронные сети уже проникли повсюду – от вашего пылесоса, который аккуратно обходит кота, до марсоходов, исследующих далекие планеты в поисках следов жизни.

      Так что же скрывают нейронные сети? Не магию, а хитроумную математику, которая маскируется под разум. Они не знают, что такое закат или аромат дождя, но способны угадать ваше настроение по лайкам в социальных сетях. Они не гении, а трудяги, которые считают быстрее, чем мы успеваем моргнуть. Эта книга станет вашим проводником за кулисы. Вы узнаете, как они работают, почему иногда дают сбои и как изменили мир, пока вы читали эту главу. Хотите раскрыть секрет, который прячется за экраном? Тогда переверните страницу – впереди вас ждет еще больше удивительного.

      2. Из тени гениальности: как родилась идея машинного разума

      Задумывались ли вы когда-нибудь, откуда берутся самые дерзкие человеческие идеи? Не из пустоты и не из стерильных