Взрыв пузыря искусственного интеллекта: реальность или миф?
Каждый день, когда акции таких гигантов полупроводниковой индустрии как Nvidia и лидеров технологий — Microsoft, Apple, Alphabet, Amazon и Meta — не возвращаются к своим летним пикам, все больше людей задаются вопросом: на грани ли пузырь искусственного интеллекта?
Не первый раз в финансовой истории ажиотаж вокруг новой технологии приводит к тому, что инвесторы раздувают стоимость компаний до нереальных величин, а затем остужаются. Политическая неопределенность вокруг американских выборов сама по себе повышает вероятность распродаж, так как Дональд Трамп выражает неприязнь к крупным технологическим компаниям и нейтральное отношение к Тайваню, где в основном производятся полупроводники, важные для ИИ.
Вопрос, который стоит гораздо глубже, заключается в том, сможет ли ИИ принести столь же колоссальную долгосрочную ценность, как интернет. Если бы вы вложили деньги в Amazon в конце 1999 года, к началу 2001 года вы бы потеряли более 90%, но сегодня ваш доход составил бы более 4000%.
Скоро ли исчерпается прогресс ИИ? Скептики громко заявляют, что ИИ вскоре столкнется с нехваткой данных. Такие модели, как GPT-4 и Gemini, уже использовали большинство интернет-данных для обучения, и, по их мнению, им не хватит данных для значительного улучшения.
Однако история вызывает сомнения в этих заявлениях. Использовать аналогию с нефтью можно более глубоко, чем просто как с основным ресурсом технологической эпохи. Как отметил футуролог Рэй Курцвейл, данные и нефть сильно различаются в трудности и стоимости их добычи и обработки.
Некоторые виды нефти легко добыть просто пробурив достаточно глубокую скважину. Другие виды требуют глубокого бурения и сложных технологий, таких как гидроразрыв или пиролиз. То же самое и с данными. Некоторые из них существуют в аккуратных наборов данных, но большинство погребено гораздо глубже и требует значительных усилий для их использования.
Из всего объема данных в интернете, от 96% до 99.8% недоступны для поисковых систем. К тому же, большинство печатного материала никогда не было оцифровано. Еще один крупный источник неиспользованных данных — информация, которая вообще не захватывается, такие как жесты хирургов или выражения лиц актеров на сцене.
После запуска OpenAI’s ChatGPT в 2022 году произошел переломный момент. Миллионы пользователей теперь платят за доступ к премиум-версиям ИИ, что создало огромный рынок, который требует еще больше данных для развития. В будущем, данные, которые сейчас находятся в недоступности, станут основой для новых моделей, выполняющих профессиональные задачи, такие как юридическое консультирование, программирование и диагностика.
Скептики правы в том, что индустрия близка к исчерпанию дешевых данных. Но как только модели ИИ начнут шире распространяться, компании будут стимулированы инвестировать в добычу более дорогих данных. Это уже привело к росту сектора по обработке данных. Компании, обладающие ныне неиспользуемыми данными, смогут выиграть от грядущих прорывов в ИИ.
Конкуренция за лучшие данные также влияет на международную политику. Законы о конфиденциальности данных определяют доступность свежих данных в различных странах. А новые методы разработки ИИ могут снизить зависимость отрасли от огромных объемов данных. Такие техники, как генерация синтетических данных и самотренировка, позволяют моделям создавать свои собственные данные для обучения.
Есть обоснованные опасения по поводу устойчивости недавнего прогресса в ИИ. Несмотря на огромный долгосрочный потенциал, краткосрочный рыночный пузырь, вероятно, лопнет прежде, чем ИИ оправдает ожидания. Но, как показывает история с нефтью, не стоит делать ставку на упадок ИИ из-за нехватки данных.
Источник: Time