Читать книгу GPT студентам. 580 промптов способных решить любую проблему. Промпт-инжиниринг для написания исследований, от плана до списка литературы, решения задач, генерации исследовательских идей, ускорения рутинных процессов, успешного и честного прохождения антиплагиат вуз - - Страница 3
АНТИПЛАГИАТ, ТОТ, КОТОРЫЙ ВУЗ
1.1. Что было до антиплагиат
ОглавлениеВУЗы и студенты (в Древнем Риме и в Средние века студентами назывались любые лица, занятые процессом познания) появились задолго до антиплагиата. Веками, находясь в процессе познания, студенты искали способы обхода рутины, беспроблемной сдачи зачетов, письменных работ и экзаменов, тем самым оживляли скучный учебный процесс некой новацией.
Тридцать лет назад будучи студентом, я искал пособие, в котором в сжатой и понятной форме излагается техника быстрого написания исследовательских работ. Читая Умберто Эко – философа и специалиста по семиотике, я понял, что скоростной методики не существует, зато есть классические правила: прийти в библиотеку, набрать тонну литературы, почитать источники, расставить в книгах закладки, сделать выписки, конспекты, скомпилировать текст, вычитать его и связать логически. С таким подходом, нормативное время написания дипломной работы составляло 3—4 месяца.
В 1994 г. в России появился Интернет, в который можно было выйти, применяя dial-up (англ. dial-up – «набор номера, дозвон»). Интернет стал наполняться электронными книгами, использование которых давало заметное ускорение при написании письменных работ.
В 2005 году в научном мире «блеснула» мысль, что работы студентов зачастую пишут не на основании источников, а на основании коллекций рефератов, поэтому было задумано бороться с такими работами, на свет появилась система «Антиплагиат», живущая в доменной зоне РУ.
Антиплагиат пошел по пути, который сейчас проходит OpenAI, да и многие другие разработчики ИИ, он начал индексировать коллекции рефератов, сетевые библиотеки и места скопления текстовой информации, понятно, что после такой индексации множество отечественных библиотек потеряли ценность своего фонда, потому что библиотеки из источника знаний превратились в источник плагиата.
Кроме добротных библиотек, имеющих отношение к академической сфере, антиплагиат, в погоне за показателями проиндексировал ресурсы, не имеющие отношения к научной деятельности, в это число попали эротические библиотеки. Разгорелся скандал, о котором писал ИД «Коммерсантъ» – один из старейших издательских домов и одна из самых авторитетных и влиятельных медиаструктур в стране. В статье «Антиплагиат» не пройдет, «Коммерсантъ» написал о казусе с индексацией Антиплагиатом РУ порно-ресурсов, рис. 1 и скандале в министерстве образования РФ.
Рисунок 1 – Антиплагиат не пройдет, ИД «Коммерсантъ»
Параллельно Антиплагиату начали развиваться другие проекты, посчитавшие возможным монетизировать данную сферу. Появилась разработка СерчИнформ (SearchInform) – Плагиат-Информ – система для определения плагиата в документах.
Наша идея технологии скоростного написания работ получила свое развитие в 2009 г. К этому времени в рамках деятельности научного объединения «ГУМАНИТАРИЙ», силами членов объединения, была собрана довольно приличная научная электронная библиотека (ЭБ), которая, по объему фонда, в несколько раз превосходила классические университетские библиотеки. Проблемой являлось библиографическое описание книг, так как имея неприлично много книг, в них было необходимо ориентироваться.
Решение подвернулось случайно. Компания «СерчИнформ» – ныне ведущий российский разработчик средств информационной безопасности, резидент Инновационного центра «Сколково», входящая в АРПП «Отечественный софт» и НП «Руссофт» – в 2008—2010 гг. разрабатывала локальную поисковую систему промышленного класса и осваивала на ее базе Плагиат-Информ – систему для определения плагиата в документах. Стресс-тестирование поисковика проводили на базе фонда ЭБ НИО «ГУМАНИТАРИЙ» (рис. 2). Плагиат-Информу мы пожертвовали свой фонд рефератов и курсовых, который насчитывал ок. 3 млн. работ.
Рисунок 2 – Пресс-релиз СёрчИнформ
В 2010 г. идея скоростного написания научных исследований получила свое развитие с новой силой. «СерчИнформ» не только предлагал возможность разнообразного поиска в локальных файлах, но и реализовывал функцию «поиска похожих» – поиск больших текстов на основании маленьких. Используя продукт СерчИнформ, мы научились извлекать необходимые данные из текстовых неструктурированных массивов, добавляя к заимствованиям библиографическую запись. Это позволяло компилировать теоретические разделы исследований за считанные часы. Генезис антиплагиата, который РУ, несколько замедлил развитие компилятивной технологии, поскольку все тексты, извлекаемые из любой электронной библиотеки, были плагиатом. В 2015 г. мы начали работы по автоматизации процесса перефразирования текстов, с целью повышения их уникальности, рис. 3. Чистовое решение было найдено в 2020 году, представлено Интернет-общественности в 2021 г., в виде проекта КонтрПлагиат.
Рисунок 3 – Перефразирование, рерайт, перепечатывание текста «другими словами»
КонтрПлагиат, академическая нейронная сеть. Цель проекта – повышение уникальности академических текстов методом глубокого перефразирования (рерайтинг), перегенерация текстов (копирайтинг).
В 2022 г. КонтрПлагиат научился работать с файлами, имеющими сложную структуру – текст, математический аппарат, таблицы, рисунки, подстрочный ссылочный аппарат.
В 2023 г. Антиплагиат РУ вывел на рынок решение – детектор генеративных текстов, созданных с помощью больших языковых моделей (LLM). На следующий день КонтрПлагиат объявил, что умеет работать с большими текстами, имеющими статус: «Внимание, документ подозрительный: в документе присутствует сгенерированный текст».
Этот статус КонтрПлагиат убирает благодаря перефразированию и компилятивным умениям, доставшимся в наследство от НИОО «ГУМАНИТАРИЙ», рис. 4.
Рисунок 4 – Генеративный текст, созданный с помощью GPT, «ДО» и «ПОСЛЕ» очеловечивания КонтрПлагиат
Как видно из краткого исторического экскурса, проблема скоростного написания исследовательских работ не нова, борьба с плагиатом в той или иной форме ведется почти два десятилетия, появление GPT заметно оживило этот процесс, наполнив академическую среду паническими настроениями. Паникуют все, профессорско-преподавательский состав, который захлестнула волна генеративных работ. Студенты, которые сгенерировали примитивные работы и не могут пройти проверку в антиплагиат версии ВУЗ.
Большие языковые модели (LLM) приходят к нам надолго и проникают во все инструментальные среды, интерфейсы, приложения и практики. Правильным, по нашему мнению, является не запрет их применения, а приобретение навыков их использования в исследовательской деятельности, что снижает рутинную составляющую и дает достаточно времени для творческого процесса.
Примером применения ИИ GPT и КонтрПлагиат выступает данное пособие, которое обобщает практический опыт и рассматривает процесс написания исследований с точки зрения – как упростить, а не с позиции классической методологии – как усложнить.