Chain-of-Thought Prompting
"Chain-of-Thought Prompting" переводится на русский как "Промптинг цепочки мыслей или дословно цепочка мыслей".
Last updated
"Chain-of-Thought Prompting" переводится на русский как "Промптинг цепочки мыслей или дословно цепочка мыслей".
Last updated
Источник изображения: Wei et al. (2022)
Представленная в исследовании Wei et al. (2022) техника формулировки промптов "цепочка мыслей" (CoT) позволяет выполнять сложные рассуждения, используя промежуточные этапы логического мышления. Этот метод можно комбинировать с методом few-shot для достижения лучших результатов в более сложных задачах, требующих последовательных рассуждений перед предоставлением ответа.
Промпт:
Результат:
Сложение всех нечетных чисел (15, 5, 13, 7, 1) дает 41. Ответ - Неверно.
печатляюще! Мы получаем отличные результаты, когда разъясняем каждый шаг рассуждения. В действительности, мы можем успешно решить эту задачу, даже предоставив меньше примеров. Оказывается, что иногда достаточно всего одного примера:
Промпт:
Результат:
Сложив все нечетные числа (15, 5, 13, 7, 1), получим 41. Ответ: Неверно.
Имейте в виду, что авторы утверждают, что такая способность проявляется у достаточно больших языковых моделях.
Источник изображения: Kojima et al. (2022)
Одной из недавних новых идей является концепция zero-shot CoT (Kojima et al. 2022), которая заключается в добавлении фразы "Давайте рассмотрим пошагово" в исходный промпт. Давайте рассмотрим простую задачу и посмотрим, как модель справится:
Промпт:
Результат:
11 яблок
Ответ неправильный! Давайте попробуем еще раз, используя специальный запрос.
Промпт:
Результат:
Сначала у вас было 10 яблок. Вы подарили 2 яблока соседу и 2 яблока ремонтнику, поэтому у вас осталось 6 яблок. Затем вы купили еще 5 яблок, и теперь у вас было 11 яблок. Наконец, вы съели 1 яблоко, поэтому у вас осталось 10 яблок.
Действительно удивительно, что такой простой запрос так хорошо подходит для решения этой задачи. Это особенно полезно, когда у вас ограниченное количество примеров для использования в промпте.