klink0v (klink0v) wrote,
klink0v
klink0v

Categories:

Про самообучающиеся системы

Наш мир наполнен самообучающимися системами. Причём их круг совершенно не ограничивается одними только нейронными сетями. Так, ещё в далёком 1961-м году британский™ учёный по имени Дональд Мичи (тот самый, который во вторую мировую войну вскрывал немецкие шифры а-ля "Энигма") разработал, описал и построил самообучающуюся машину для игры в "Крестики-нолики", состоящую из... трёхсот самых обыкновенных спичечных коробков и бусинок четырёх разных цветов. Чуть позднее (в 1970-х) другой математик, Мартин Гарднер, в своей книге "Математические досуги" предложил всем желающим чисто ради развлечения сделать упрощённый вариант такого "робота" из двацати четырёх спичечных коробков и поиграть с ним в "Шесть пешек".

Если кому интересно, описание такой "машины" и игры можно найти здесь, глава 14, страница 170.

Что характерно, принцип работы любой самообучающейся системы, — от спичечных коробков до человеческого мозга, очень прост. В той или иной ситуации каждый раз принимается рандомное (случайное) решение из N различных вариантов. За решением следует либо поощрение системы (получилось что-то хорошее, позитив), либо наказание (случилось что-то плохое, негатив). После этого система по каким-либо критериям самостоятельно корректирует либо набор вариантов, либо алгоритм выбора, либо и то и другое сразу. И когда в дальнейшем перед системой возникнет аналогичная ситуация с похожим выбором, она (в норме) выберет тот вариант, который с бо́льшей вероятностью приведёт к поощрению. То есть,  "самообучится".

Резюмируя, можем постулировать следующее. Для успешного обучения необходимо наличие трёх компонентов: варианты, поощрение, наказание.

Теперь плавно перейдём от интеллекта искусственного к интеллекту естественному: людям. В качестве вариантов у них, как правило, выступают какие-либо примеры из жизни (так делали родители, так раньше делал сам, видел где-то у друзей, в крайне редких случаях — придумал что-то своё), в роли поощрения — дофамин, в роли наказания... хм, да там очень-очень много всего есть для наказания. Спектр крайне широк и разнообразен: начиная от физической боли и заканчивая психическим "самоедством".

И так уж устроен мозг среднестатистического гомосапиенса, что негатив он помнит куда лучше и дольше, нежели позитив. Недаром бытует пословица "хорошее быстро забывается". Отсюда следует простое заключение. Чем больше человек знает и умеет (грубо говоря, чем он умнее), тем больше у него в голове всякого г...на, которое ему мешает жить. Просто потому, что он больше всего повидал-испытал-пережил, соответственно жизнь его чаще и "наказывала". Кстати, отсюда же растут ноги и у другой пословицы: "Бо́льшие знания — бо́льшие печали".

Но к чему я это все веду? Допустим, вам нужен под какой-нибудь длительный и достаточно сложный проект компаньон (напарник, друг, помощник — нужное подчеркнуть). Под словом "проект" здесь можно понимать что угодно: начиная от открытия собственного автосервиса в гараже, заканчивая экспедицией на Марс. От "сходить в двухнедельный поход" до "прожить остаток жизни". Кого вы выберете? Более умного-опытного, который способен решать самые сложные задачи, или того, кто позитивно настроен и сможет оказать моральную поддержку в трудную минуту?

Думаете, бывают люди, которые могут совмещать в себе оба качества: многоопытность и жизнерадостность? Мои личные наблюдения показывают, что нет. Матёрые всеумеющие "стреляные воробьи" неизбежно будут скатываться в депрессию в самые неподходящие моменты. А "радостные живчики" очень хорошо поддерживают боевой дух и мораль своего собрата, но им нельзя делегировать сложные вопросы: провалят.

Конечно, в чистом виде ни тех, ни других не существует. Всегда есть какое-то соотношение со смещением в ту или иную сторону. Наверное, бывают и какие-то яркие редкие исключения, которые со временем добиваются головокружительных успехов. Или погибают. Потому что не боятся каждый раз после очередной неудачи пробовать снова, снова, и снова. В чём-то я им даже завидую. Но в людях из "серой массы" обычно приходится искать компромисс: радость или навыки. И где находится та самая "оптимальная" граница, "золотая середина"? Я не знаю.

Tags: размышления
Subscribe

  • ОколоITшный дыбр #47

    ... После декабря 2022 года Мегафон отключил возможность принимать / отправлять SMSки через "фирменное" приложение eMotion. Я не отследил…

  • Социальный эксперимент на Avito

    ... Мама некоторое время тому назад приобрела себе новую стиральную машину. Старая, соответственно, оказалась не нужна. Поскольку она сильно б/у,…

  • Жулики или нет?

    Вчера (воскресенье) позвонил какой-то странный поц с номера Билайн-Москва. С ним состоялся примерно следующий разговор. Все имена изменены, названия…

  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

  • 7 comments