Верховный алгоритм: как машинное обучение изменит наш мир - Педро Домингос (2015)

Год:

2015
Название:

Верховный алгоритм: как машинное обучение изменит наш мир
Автор:

Педро Домингос
Жанр:

Наука, Образование
Язык:

Русский
Перевел:

Василий Горохов
Издательство:

Манн, Иванов и Фербер (МИФ)
Страниц:

21
ISBN:

978-5-00100-172-0
Рейтинг:

0 (0 голос)
Ваша оценка:
0

1

2

3

4

5

Машинное изучение преобразует науку, технологию, бизнес и разрешает поглубже признать природу и человечное поведение. Программирующие сами себя компы – 1 из самых весомых передовых технологий, и она же – 1 из самых загадочных. «Машинное изучение обрамляет вас везде, но, имеет возможность быть, вы об данном и не подозреваете. Как раз спасибо машинному обучению поисковая автомат осознает, какие итоги выказывать в ответ на ваш запрос. Когда вы просматриваете почту, гигантская доля мусора протекает мимо вас, вследствие того собственно что он был отфильтрован с поддержкой машинного изучения. В случае если вы приняли решение чего-нибудь приобрести на Amazon или же заглянули на Netflix взглянуть кинофильм, система машинного изучения услужливо предложит варианты, которые имеют все шансы достаться для вас по вкусу. С поддержкой машинного изучения Facebook постановляет, какие анонсы для вас выказывать, а Twitter выбирает благоприятные твиты. Когда бы вы ни использовали компом, довольно наверное, собственно что кое-где задействовано машинное изучение.
Единым методикой вынудить компьютер что-нибудь создавать — от сложения 2-ух количеств до управления самолетом — было формирование.»

Верховный алгоритм: как машинное обучение изменит наш мир - Педро Домингос читать онлайн бесплатно полную версию книги

Добавить в свои закладки на сайте Версия для слабовидящих

Машинное обучение – все равно что научный метод с допингом. Оно следует той же схеме обобщения, проверки, исключения и уточнения гипотез, однако ученый может за свою жизнь придумать и протестировать несколько сотен предположений, а система машинного обучения проделает то же самое в долю секунды. Машинное обучение ставит открытия на поток, поэтому неудивительно, что в науке оно производит революцию, во многом подобную революции в бизнесе.

Чтобы развиваться, любая область науки нуждается в данных, соизмеримых по сложности с явлениями, которые она изучает. Именно поэтому физика первой пошла вперед: записей Тихо Браге о положении планет и наблюдений Галилея за маятником и наклонными плоскостями оказалось достаточно, чтобы сформулировать законы Ньютона. По той же причине молекулярная биология обогнала более старую нейробиологию: ДНК-микрочипы и высокоэффективное секвенирование дают столько данных, сколько нейробиологам и не снилось. Социальные науки находятся в этом отношении в невыгодном положении: с выборкой всего лишь в сотню человек по десятку измерений на каждого смоделировать получается лишь очень узкие явления. Но даже такие небольшие феномены не существуют в изоляции: на них влияют мириады факторов, а это значит, что ученые очень далеки от того, чтобы их понять.

Хорошая новость: сегодня даже науки, некогда оперировавшие небольшими объемами информации, получили приток данных. Вместо того чтобы платить 50 студентам, которые будут клевать носом в лаборатории психолога, можно получить сколько угодно испытуемых, дав задание краудсорсинговой площадке Amazon Mechanical Turk (к тому же выборка окажется более разнообразной). Сейчас уже не все помнят, как немногим более десятилетия назад социологи, изучавшие социальные сети, жаловались, что не могут найти такую сеть, в которой было бы больше нескольких сотен участников. Теперь в их распоряжении весь Facebook, где больше миллиарда пользователей рассказывают о своей жизни во всех подробностях – чем не прямая трансляция общественной жизни на планете Земля? Коннектомика[10] и функциональная магнитно-резонансная томография распахнули перед нейробиологами окно, через которое прекрасно виден головной мозг. В молекулярной биологии экспоненциально растут базы данных генов и белков. Даже «старые» дисциплины, например физика и астрономия, не стоят на месте благодаря потокам данных, льющимся из ускорителей частиц и цифрового исследования неба.

Однако от больших данных нет пользы, если их нельзя превратить в знание, и в мире слишком мало ученых, чтобы справиться с этой задачей. В свое время Эдвин Хаббл[11] открывал новые галактики, скрупулезно изучая фотографические пластинки, но можно ручаться, что таким способом не получилось бы найти полмиллиарда небесных тел, которые нам подарил проект Digital Sky Survey, – это было бы подобно ручному подсчету песчинок на пляже. Конечно, можно вручную написать правила, чтобы отличить галактики от звезд и шумов (например, птиц, самолетов или пролетающего мимо Супермена), но они будут не очень точными. Поэтому в проекте SKICAT, посвященном анализу и каталогизации изображений неба, был применен обучающийся алгоритм. Получив пластинки, где объектам уже были присвоены правильные категории, он разобрался, что характеризует каждую из них, а затем применил результаты ко всем необозначенным пластинкам. Эффективность превзошла все ожидания: алгоритм сумел классифицировать объекты настолько слабые, что человек не смог бы их выявить, и таких оказалось больше всего.