OpenAI представил ИИ-модель, способную генерировать выжимки из книг

Специалисты стартапа OpenAI разработали на базе GPT-3 ИИ-модель, способную генерировать выжимки из книг. Выкладывать ее исходный код в открытый доступ компания не планирует.

По словам разработчиков, представленная ИИ-модель является частью постоянных исследований OpenAI по развитию ИИ-технологий. Модель делит произведения на разделы. Впоследствии выжимки из каждого раздела объединяются в связный текст.

Для демонстрации способностей ИИ-модели разработчики решили использовать произведение «Алиса в Стране чудес». В этой книге насчитывается 26 тыс. слов. Модель создала на ее основе 66 выжимок на 6 тыс. слов. Далее количество выжимок было сокращено до шести на 830 слов. Количество слов в финальном пересказе составило 136.

По данным VentureBeat, для обучения ИИ-модели разработчики использовали художественные произведения, содержащие в среднем свыше 100 000 слов. Чтобы оценить эффективность модели, специалисты стартапа взяли 40 наиболее востребованных в 2020 году на рынке книг. Двум участникам эксперимента было поручено прочесть их с целью написания выжимок. Впоследствии сделанные людьми выжимки исследователи сравнили с выжимками ИИ-модели.

Разработчики утверждают, что создаваемые моделью тексты имеют «уровень книги». В них содержится большая часть информации. Иногда из-за отсутствия контекста модель генерирует неточные утверждения.