Вячеслав Мустакимов

GPT юристам. 500 промптов повышающих производительность в 1000 раз. Промпт-инжиниринг для написания исследований, от плана до антиплагиата, решения задач, генерации творческих идей, ускорения рутинных процессов


Скачать книгу

подчеркивает обязанность государства обеспечивать защиту прав и законных интересов каждого гражданина. Это означает, что разрешительная система является неотъемлемой частью действующего законодательства.

      Имея текст источника, GPT сгенерировал новый текст, Рис. 17.

      Достаточно часто, тексты используются в исследовательских работах подлежат проверки в сервисах антиплагиат. Сегодня как антиплагиат, так и поисковые сервисы детектируют генеративные тексты GPT и отбраковывают их. Все это актуализирует наличие как сервисов перефразирования с целью повышения уникальности, так и сервисов очеловечивания, предотвращающих обнаружение текстов ИИ как генеративных.

      В основе антиплагиат проверок лежит метод Шингла.

      Шингл – последовательность количества слов, используемая в алгоритме проверки уникальности текста. Уникальность проверяется путем сравнения нового текста с текстом, который уже был проиндексирован. Для этого осуществляется разбиение текста на фрагменты – шинглы, конец каждого фрагмента является началом предыдущего, Рис. 17.

      Рисунок 16 – Лемматизированный текст, КонтрПлагиат работает с шинглами, состоящими из 2 слов

      Рисунок 17 – Сверка отличия текстов левое окно – перефразированный текст, правое окно – текст источника, отличие текстов 55%, желтым выделен текст, который не изменился

      Текст, сгенерированный GPT имеет две проблемы, первая, низкое отличие от источника, на уровне 55%, такой текст не пройдет проверку в антиплагиат ВУЗ, т.к. нормативное отличие, которое требуется – более 80%. Вторая проблема заключена в том, что текст GPT – генеративный, а значит ему будет присвоен статус – «Внимание, документ подозрительный: в документе присутствует сгенерированный текст».

      Рассмотрим на примере, как можно повысить уникальность генеративного текста, избавив его от статуса «Подозрительны». Для этого обратимся к возможностям сервиса КонтрПлагиат, Рис. 18.

      Рисунок 18 – Сверка отличия текстов левое окно – перефразированный текст, правое окно – текст источника, отличие текстов 84%

      Как показывает Рис. 18, достигнуто отличие текстов на уровне 84%, что превышает нормативное требование, следовательно текст пройдет проверку в антиплагиат и не получит статус подозрительного документа, поскольку был перефразирован с учетом человеческого подхода к глубокому рерайту.

      Таким образом, не смотря на все выявленные проблемы, GPT представляет собой интересный инструмент, позволяющий работать с текстом, все текущие недостатки GPT могут быть нивелированы за счет человеческого участия. Человек, освобожденный от рутинного процесса выступает в качестве эксперта, принимает окончательное решение о возможности использования текста. Недостаточный уровень оригинальности текстов и очеловечивание генеративного текста не являются