Knigionline.co » Компьютеры » Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры

Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры - Эйден Эрец (2013)

Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры
  • Год:
    2013
  • Название:
    Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры
  • Автор:
  • Жанр:
  • Серия:
  • Язык:
    Русский
  • Перевел:
    Павел Миронов
  • Издательство:
    АСТ
  • Страниц:
    31
  • ISBN:
    978-5-17-088935-8
  • Рейтинг:
    0 (0 голос)
  • Ваша оценка:
Насколько бывают масштабны на самом деле «большие данные» – громадные массивы информации, о коих столько много ведутся обсуждения в последнее время? Вот наглядный пример: если выписать в одну линейку все цифры 0 и 1, из которых состоит один терабайт информации (вполне себе обыкновенная емкость для передового жесткого диска), то цепочка цифр окажется в пятьдесят раз длиннее, чем расстояние от нашей планеты до Сатурна! Однако, на «большие данные» абсолютно возможно взглянуть в человеческом измерении. Жан-Батист Мишель и Эрец Эйден это – языковеды и компьютерные таланты, разработчики обслуживания Гугл Ngram Viewer и термина «культуромика», демонстрируют, каким образом анализирование «больших данных» может помочь изучать сложные трудности языка, ситуации и культуры.

Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры - Эйден Эрец читать онлайн бесплатно полную версию книги

В процессе изучения трансформации неправильных глаголов в правильные мы обнаружили, что если мы примем во внимание частоту употребления, то процесс выравнивания будет неотличим с математической точки зрения от процесса распада радиоактивного атома. Более того, зная частоту употребления неправильного глагола, мы могли создать формулу для расчета периода его полураспада. Это было замечательно, поскольку в случае радиоактивных атомов период полураспада определяется экспериментальным путем; его обычно невозможно рассчитать. В этом смысле математика радиоактивности лучше подходит неправильным глаголам, а не радиоактивным атомам.

Формула была простой и прекрасной – период полураспада глагола представляет собой квадратный корень от частоты его употребления. Неправильный глагол, использующийся в сто раз реже, приобретет правильную форму в десять раз быстрее.

Например, у глаголов, частота употребления которых находится в пределах между одним из ста и одним из тысячи, – глаголов типа drink («пить») или speak («говорить») – период полураспада составляет примерно 5400 лет. Это сопоставимо с периодом полураспада углерода-14 (5715 лет), изотопа, который чаще других используется для датирования древних артефактов.

Будущее прошедшее

Как только вы рассчитаете период полураспада неправильных глаголов, у вас появляется возможность сделать прогнозы об их будущем. Основываясь на вышеупомянутом анализе, мы предсказали, что к определенному времени один из глаголов из набора begin («начать»), break («ломать»), bring («приносить»), buy («покупать»), choose («выбирать»), draw («рисовать»), drink («пить»), drive («ехать»), eat («есть»), fall («падать») превратится в правильный. Из набора bid («предлагать цену»), dive («нырять»), heave («вздыматься»), shear («стричь»), shed («ронять»), slay («убивать»), slit («перерезать»), sow («сеять»), sting («жалить»), stink («вонять») правильными станут пять глаголов. А если процесс пойдет так и дальше, то к 2500 году неправильными останутся лишь 83 из наших 177 неправильных глаголов.

Мы были настолько рады своим открытиям, что даже создали короткую историю на основе своих прогнозов:

Он был хорошо воспитанным представителем XXVI столетия, поэтому его задели (stinged) слова о том, что используемая им грамматика «воняет» (stunk). «Stinked», – поправил своих собеседников путешественник во времени.

Так что, если вы планируете в ближайшее время заняться путешествиями во времени, вам стоит запомнить эту поучительную историю.

Мы также предсказали судьбу некоторых глаголов. Какие из сегодняшних неправильных глаголов после тысячи лет, проведенных вместе, откажутся от нынешнего партнера по спряжению в пользу «молодой модели»? Как ни парадоксально, это глагол wed – wed («женить»), один из самых редко употребляемых современных неправильных глаголов. К примеру, уже сейчас в обиход входит форма wed – wedded. Так что скоро уже вы как новобрачные не сможете назвать себя newly wed.

И, наконец, мы смогли ответить на «детский» вопрос, с которого начали свое путешествие: «Почему мы говорим drove, а не drived?»

Причина, по которой мы все еще говорим drove – отказавшись при этом от других неправильных форм типа throve, – состоит в том, что drove используется в сотни раз чаще, чем throve. Это значит – основываясь на нашем небольшом уравнении, – что для drove вероятность стать правильным в десять раз меньше, чем для throve. Разумеется, со временем drove исчезнет, если английский язык проживет достаточно долго[68]. Наши расчеты показывают, что у нас есть примерно 7800 лет, перед тем как глагол drove скроется в лучах заката. Так что дети еще какое-то – довольно долгое – время будут задавать свой детский вопрос.

Блестящая туфля Джона Гарварда

Перейти
Наш сайт автоматически запоминает страницу, где вы остановились, вы можете продолжить чтение в любой момент
Оставить комментарий