Кончаются ли данные для ИИ? История нефти говорит обратное

Кончаются ли данные для ИИ? История нефти говорит обратное Кончаются ли данные для ИИ? История нефти говорит обратное

Взрыв пузыря искусственного интеллекта: реальность или миф?

Каждый день, когда акции таких гигантов полупроводниковой индустрии как Nvidia и лидеров технологий — Microsoft, Apple, Alphabet, Amazon и Meta — не возвращаются к своим летним пикам, все больше людей задаются вопросом: на грани ли пузырь искусственного интеллекта?

Не первый раз в финансовой истории ажиотаж вокруг новой технологии приводит к тому, что инвесторы раздувают стоимость компаний до нереальных величин, а затем остужаются. Политическая неопределенность вокруг американских выборов сама по себе повышает вероятность распродаж, так как Дональд Трамп выражает неприязнь к крупным технологическим компаниям и нейтральное отношение к Тайваню, где в основном производятся полупроводники, важные для ИИ.

Реклама

Вопрос, который стоит гораздо глубже, заключается в том, сможет ли ИИ принести столь же колоссальную долгосрочную ценность, как интернет. Если бы вы вложили деньги в Amazon в конце 1999 года, к началу 2001 года вы бы потеряли более 90%, но сегодня ваш доход составил бы более 4000%.

Скоро ли исчерпается прогресс ИИ? Скептики громко заявляют, что ИИ вскоре столкнется с нехваткой данных. Такие модели, как GPT-4 и Gemini, уже использовали большинство интернет-данных для обучения, и, по их мнению, им не хватит данных для значительного улучшения.

Однако история вызывает сомнения в этих заявлениях. Использовать аналогию с нефтью можно более глубоко, чем просто как с основным ресурсом технологической эпохи. Как отметил футуролог Рэй Курцвейл, данные и нефть сильно различаются в трудности и стоимости их добычи и обработки.

Некоторые виды нефти легко добыть просто пробурив достаточно глубокую скважину. Другие виды требуют глубокого бурения и сложных технологий, таких как гидроразрыв или пиролиз. То же самое и с данными. Некоторые из них существуют в аккуратных наборов данных, но большинство погребено гораздо глубже и требует значительных усилий для их использования.

Из всего объема данных в интернете, от 96% до 99.8% недоступны для поисковых систем. К тому же, большинство печатного материала никогда не было оцифровано. Еще один крупный источник неиспользованных данных — информация, которая вообще не захватывается, такие как жесты хирургов или выражения лиц актеров на сцене.

После запуска OpenAI’s ChatGPT в 2022 году произошел переломный момент. Миллионы пользователей теперь платят за доступ к премиум-версиям ИИ, что создало огромный рынок, который требует еще больше данных для развития. В будущем, данные, которые сейчас находятся в недоступности, станут основой для новых моделей, выполняющих профессиональные задачи, такие как юридическое консультирование, программирование и диагностика.

Скептики правы в том, что индустрия близка к исчерпанию дешевых данных. Но как только модели ИИ начнут шире распространяться, компании будут стимулированы инвестировать в добычу более дорогих данных. Это уже привело к росту сектора по обработке данных. Компании, обладающие ныне неиспользуемыми данными, смогут выиграть от грядущих прорывов в ИИ.

Конкуренция за лучшие данные также влияет на международную политику. Законы о конфиденциальности данных определяют доступность свежих данных в различных странах. А новые методы разработки ИИ могут снизить зависимость отрасли от огромных объемов данных. Такие техники, как генерация синтетических данных и самотренировка, позволяют моделям создавать свои собственные данные для обучения.

Есть обоснованные опасения по поводу устойчивости недавнего прогресса в ИИ. Несмотря на огромный долгосрочный потенциал, краткосрочный рыночный пузырь, вероятно, лопнет прежде, чем ИИ оправдает ожидания. Но, как показывает история с нефтью, не стоит делать ставку на упадок ИИ из-за нехватки данных.

Источник: Time

Добавить комментарий

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Будьте в курсе самых важных событий

Нажимая кнопку "Подписаться", вы подтверждаете, что ознакомились с нашими условиями и соглашаетесь с ними. Политика конфиденциальности и Условия использования
Реклама