Active-Prompt

"Active-Prompt" переводится дословно на русский как "Активный промптинг"

Техника "Промптинга Цепочки Мыслей" (CoT) использует заранее заданные примеры, которые были аннотированы людьми. Однако бывает, что эти примеры не всегда идеально подходят для разных задач. Чтобы решить эту проблему, Diao и др., (2023) предложили новый способ, который называется "Active-Prompt - Активный промпт". Этот метод позволяет адаптировать языковую модель (LLM) к разным задачам, используя конкретные примеры, которые разработаны вручную.

Давайте посмотрим на иллюстрацию этого метода. Сначала мы делаем запрос к языковой модели (LLM) с несколькими примерами из "Промптинга Цепочки Мыслей" (CoT) или без них. Для набора учебных вопросов создаются k возможных ответов. Затем мы вычисляем метрику неопределенности, основанную на этих k ответах (используется показатель расхождения). Самые неопределенные вопросы выбираются для аннотации специалистами. После этого новые аннотированные примеры используются для генерации ответов на каждый вопрос.

Давайте посмотрим, как это работает, как на пальцах. Представьте, что у нас есть компьютер, который отвечает на вопросы. Но иногда он может сделать ошибку или не понять вопрос. Чтобы улучшить его ответы, мы спрашиваем у него много вопросов и смотрим, какие из них вызывают больше сомнений. Эти вопросы мы задаем людям и получаем от них точные ответы. Затем мы используем эти точные ответы, чтобы обучить компьютер отвечать лучше на другие вопросы. Таким образом, мы делаем компьютер "умнее" с помощью людей.

Источник изображения: Diao и др., (2023)

Last updated