Распознавание агентом естественного языка

icon picker
Распознавание естественного языка

Распознавание естественного языка
@Агент
ами выполняется с помощью
@Слот
а
@NLU
.
@Слот
@NLU
обучается на
@Обучающая выборка
включенных в него
@Интент
ов.
Подробнее о создании
@Интент
ов: .

Обучающая выборка Интента

@Обучающая выборка
— это фразы с одинаковым или близким смыслом, с помощью которых человек может высказать конкретное намерение (
@Интент
), и на которых обучается модель
@NLU
с целью распознавания этих и всех прочих вариантов высказывания того же намерения (
@Интент
а). От качества
@Обучающая выборка
напрямую зависит качество распознавания в
@Агент
е.
Цель, к которой нужно стремиться при составлении выборки — дать
@Агент
у как можно больше разнообразных вариантов формулировки намерения (но в пределах 30 фраз).
@Слот
@NLU
, обученный на конкретной
@Обучающая выборка
, будет распознавать не только
@Реплика
@Собеседник
а, полностью повторяющие
@Обучающая фраза
из выборки, но и
@Реплика
, близкие по смыслу.

Рекомендации по наполнению обучающей выборки Интентов

Для успешного распознавания рекомендуется:
Подобрать от 10 до 30 обучающих фраз-примеров к каждому
@Интент
у.
@Обучающая фраза
одного
@Интент
а должны быть синонимичны друг другу – обозначать одно и то же намерение.
@Обучающая фраза
должны представлять собой набор фраз, осмысленных предложений, а не набор ключевых слов или тематик.
@Обучающая выборка
должна быть разнообразной. Для этого следует использовать различные синонимы к словам и различные формулировки намерений.
Фразы из
@Обучающая выборка
должны звучать реалистично. Для того чтобы понять, как
@Собеседник
и формулируют вопросы, можно, к примеру, просмотреть историю общения
@Собеседник
ов с консультантом или оператором поддержки в чате.

Рекомендации по списку Интентов

Очень важно не только грамотно наполнить
@Обучающая выборка
@Интент
ов, но и корректно составить список самих
@Интент
ов:
Близкие по смыслу
@Интент
ы стоит объединять. Если выборки разных
@Интент
ов будут очень близки по смыслу, с большой вероятностью
@NLU
будет "путаться" между ними, т.е.
@Реплика
, которые могут относиться к одному из них,
@NLU
может отнести к
@fallback
-у.
@Интент
ы, содержащие различные по смыслу намерения, стоит разделять.
@Интент
, который содержит множество хоть и относящихся к одной тематике, но все же различных намерений, лучше разделить на несколько отдельных. Таким образом
@NLU
@Агент
а сможет более точно составить представление о смысле каждого
@Интент
а и более точно распознавать их в будущем.
Залог качественного распознавания в
@Агент
е — это не только грамотно составленный список
@Интент
ов и
@Обучающая выборка
, но и тестирование. Подробнее:
Важно: необходимо избегать случайного совпадения
@Обучающая фраза
в выборках разных
@Интент
ов — если в разных
@Интент
ах находится одна и та же
@Обучающая фраза
, то совпадающая с ней
@Реплика
@Собеседник
а будет отнесена
@NLU
к одному из этих
@Интент
ов случайным образом.
Want to print your doc?
This is not the way.
Try clicking the ⋯ next to your doc name or using a keyboard shortcut (
CtrlP
) instead.