News
Лента
News
Суббота
Июль 13
Вся лента

Системы искусственного интеллекта (ИИ) могут поглотить все свободные знания интернета уже в 2026 году, предупреждают ученые в новом исследовании.

Модели искусственного интеллекта, такие как GPT-4, на котором основан ChatGPT, или Claude 3 Opus, опираются на многие триллионы слов, которыми обмениваются в сети, чтобы стать умнее. Однако новые прогнозы показывают, что они исчерпают запасы общедоступных данных где-то между 2026 и 2032 годами.

Это означает, что для создания более совершенных моделей технологическим компаниям придется искать данные в других местах. Это может включать в себя создание синтетических данных, обращение к менее качественным источникам или, что более тревожно, к частным данным на серверах, где хранятся сообщения и электронная почта. Исследователи опубликовали свои результаты на сервере препринтов arXiv.

Результаты показали, что высококачественная информация, взятая из надежных источников, будет исчерпана не позднее 2032 года, а низкокачественные языковые данные будут израсходованы между 2030 и 2050 годами. Данные об изображениях будут полностью исчерпаны между 2030 и 2060 годами.

Было доказано, что нейронные сети предсказуемо улучшаются по мере увеличения их наборов данных - явление, называемое законом нейронного масштабирования. Поэтому остается открытым вопрос, могут ли компании повысить эффективность моделей, чтобы учесть нехватку свежих данных, или же отключение «крана» приведет к тому, что прогресс остановится.

Однако, по словам автора исследования Пабло Вильялобоса, маловероятно, что нехватка данных резко затормозит развитие моделей искусственного интеллекта в будущем. 

!
Этот текст доступен на   Հայերեն
Распечатать
Самое