» » » Неизведанная территория. Как "большие данные" помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры - Жан-Батист Мишель

Неизведанная территория. Как "большие данные" помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры - Жан-Батист Мишель

Книгу Неизведанная территория. Как "большие данные" помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры - Жан-Батист Мишель читаем онлайн бесплатно и без регистрации! Читать онлайн вы можете не только на компьютере, но и на андроид (Android), iPhone и iPad. Наслаждайтесь!

203 0 13:27, 25-05-2019
Неизведанная территория. Как "большие данные" помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры - Жан-Батист Мишель
25 май 2019
Автор: Эйден Эрец Жан-Батист Мишель Жанр: Книги / Домашняя Год публикации: 2016 Возрастные ограничения: (18+) Внимание! Аудиокнига может содержать контент только для совершеннолетних.
0 0

Книга Неизведанная территория. Как "большие данные" помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры - Жан-Батист Мишель читать онлайн бесплатно без регистрации

Насколько велики на самом деле «большие данные» – огромные массивы информации, о которых так много говорят в последнее время? Вот наглядный пример: если выписать в линейку все цифры 0 и 1, из которых состоит один терабайт информации (вполне обычная емкость для современного жесткого диска), то цепочка цифр окажется в 50 раз длиннее, чем расстояние от Земли до Сатурна! И тем не менее, на «большие данные» вполне можно взглянуть в человеческом измерении. Эрец Эйден и Жан-Батист Мишель – лингвисты и компьютерные гении, создатели сервиса Google Ngram Viewer и термина «культуромика», показывают, каким образом анализ «больших данных» помогает исследовать трудные проблемы языка, культуры и истории.
1 ... 52 53 54 55 56 57 58 59 60 ... 65
Перейти на страницу:

К счастью, все больше новых книг появляется в цифровой форме и распространяется в электронном виде сразу же с момента публикации. Поскольку сейчас издается больше книг, чем когда-либо прежде в человеческой истории, доля книг, существующих в цифровой форме, значительно увеличивается с каждым днем.

Тем не менее у нас все равно остается проблема старых книг, существующих, к нашему неудобству, лишь в виде физических объектов. Именно здесь должны быть сконцентрированы основные усилия в области оцифровки. Частные корпорации и правительства занимаются этим вопросом, желая как сохранить наше коллективное наследие, так и заработать на нем. Во главе процесса остается Google. Компания уже оцифровала свыше 30 из 130 миллионов книг, существующих в наши дни. По ее расчетам, работа будет завершена к 2020 году. Иными словами, есть основания полагать, что вскоре подавляющее большинство имеющихся книг будет доступно в цифровом формате.

С количественной точки зрения это 25-кратное увеличение базы – с 4 до 100% – окажет огромное влияние на качество наблюдений, доступных для нашего культурного телескопа. Как не вспомнить о Галилее, вытолкнувшем Землю с центрального места во Вселенной с помощью телескопа, который был всего в тридцать раз более зорким, чем невооруженный глаз.

Несмотря на это, у нашего процесса изучения книг имеется целый ряд серьезных трудностей.

Первая из них связана с законодательством об авторском праве – более агрессивным, чем во времена По, и настолько же устаревшим. Хорошим примером может служить закон о продлении срока копирайта 1998 года. Согласно этому акту, авторские права на произведения сохраняются в течение 70 лет после смерти автора. По сути, это препятствует онлайновому изучению почти всех книг, опубликованных после 1923 года, причем в законе не делалось исключений для цифровых исследований или цифровых библиотек. Организации наподобие Internet Archive, HathiTrust и проекта «Гутенберг» прилагают массу усилий, чтобы сделать книги максимально доступными[198]. Однако состояние законодательства в области авторского права таково, что они практически бессильны, когда речь заходит о книгах, опубликованных в прошлом столетии.

Это оказывает влияние на остальные элементы нашей информационной экосистемы. Например, наша исследовательская группа под названием «Культурная обсерватория» создала открытые инструменты, более мощные, чем Ngram Viewer, и способные разделять и анализировать данные книг множеством разных способов. Мы способны моментально изучить, как использовалось слово «ворон» на территории Соединенных Штатов в поэтических произведениях авторов в возрасте чуть за тридцать. Но мы можем сделать это только по данным до 1923 года. Когда дело касается прошлого столетия, то любой юрист, стоящий на страже корпоративных интересов, воскликнет (на манер ворона – героя стихотворения По): «Никогда!»

Есть и еще одна, значительно более серьезная опасность, с которой сталкиваются книги. По мере того как цифровые книги и цифровая информация получают все большее распространение, выживание физических книг оказывается под угрозой сразу на нескольких фронтах. Уже через три года после появления на рынке платформы Kindle для чтения электронных книг продажи книг в формате Kindle на сайте Amazon превысили по объему продажи бумажных[199]. И это происходит не только в Amazon – в последние годы произошел вполне заметный сдвиг в сторону электронных книг на любых платформах и от любых продавцов. Разумеется, в долгосрочной перспективе печатный вид сохранят тексты огромной важности и значения, вроде Библии. Однако таких текстов немного. Длинный хвост ципфовского распределения показывает, что печать книг пойдет по пути развития неправильных глаголов. Через несколько лет книги наподобие нашей не будут иметь печатного вида.

Книги в своем физическом виде находятся под угрозой даже в своей привычной цитадели – библиотеке[200]. На протяжении тысячелетий библиотека была единственным учреждением, призванным сохранять исторические записи. Однако в отличие от активно развивающихся онлайн-библиотек, их традиционные физические сородичи сталкиваются с большими проблемами. Через несколько лет у 60% библиотек бюджет снизится или вообще исчезнет. При отсутствии достаточного объема площадей и финансов библиотекам придется избавляться от целого ряда старых книг, чтобы выделить место для новых. Проблема состоит в том, что библиотеки не могут просто раздать свои старые книги. В библиотечные книги встроены специальные устройства, препятствующие воровству. И это приведет к тому, что честные люди будут время от времени считать, что эти книги были когда-то похищены из библиотек, и приносить их обратно. Удалять эти отслеживающие устройства довольно дорого. Поэтому библиотеки часто предпочитают сделать то, что кажется нам немыслимым, – они тайно уничтожают книги. Это происходит в огромных масштабах. Крупные библиотеки иногда разом избавляются от сотен тысяч книг.

Какие же книги покидают библиотеки? Практика варьируется, однако в целом библиотеки не особенно церемонятся с книгами. Мало кто прилагает усилия для отслеживания того, что мы теряем. В одном недавнем случае были уничтожены книги из библиотеки бывшего британского премьер-министра Дэвида Ллойд-Джорджа. Время от времени библиотека будет решать, от каких книг избавиться, проверяя, какие из них уже оцифровала Google. В результате мы внезапно можем лишиться значительной доли своего культурного наследия. Несколько глав назад мы рассказали о том, как цензура способна задавить те или иные идеи. Здесь же происходит обратное – попытки сделать книги более доступными угрожают их физическому выживанию. Оцифровка книг приводит к весьма противоречивым результатам.

1 ... 52 53 54 55 56 57 58 59 60 ... 65
Перейти на страницу:
  1. Жалоба
Отзывы - 0

Прочитали книгу? Предлагаем вам поделится своим впечатлением! Ваш отзыв будет полезен читателям, которые еще только собираются познакомиться с произведением.


Уважаемые читатели, слушатели и просто посетители нашей библиотеки! Просим Вас придерживаться определенных правил при комментировании литературных произведений.

Просьба отказаться от дискриминационных высказываний. Мы защищаем право наших читателей свободно выражать свою точку зрения. Вместе с тем мы не терпим агрессии. На сайте запрещено оставлять комментарий, который содержит унизительные высказывания или призывы к насилию по отношению к отдельным лицам или группам людей на основании их расы, этнического происхождения, вероисповедания, недееспособности, пола, возраста, статуса ветерана, касты или сексуальной ориентации. Просьба отказаться от оскорблений, угроз и запугиваний. Просьба отказаться от нецензурной лексики. Просьба вести себя максимально корректно как по отношению к авторам, так и по отношению к другим читателям и их комментариям.

Надеемся на Ваше понимание и благоразумие. С уважением, администратор My-Books.me.


Новые отзывы

  1. Александра Александра15 январь 09:37 Очень интересная книга! Особенно, если любишь психологию и хочешь понимать себя и других. Обязательно послушаю до конца. Спасибо.... Кригер Борис – Гнев
  2. Галина Галина25 май 13:02 Очень уважаю Артема Шейнина, книга замечательная, очень мне близкая по духу.Перечитываю уже второй раз, столько пережитого и не... Мне повезло вернуться - Артем Шейнин
  3. Екатерина Екатерина11 январь 08:05 Доброе утро. Подскажите пожалуйста как сохранять книги, ставить закладки?... Подонок - Анастасия Леманн
Все комметарии
Новинки бесплатной онлайн библиотеки