Практика проверок выпускных квалификационных работ и научных трудов на наличие текстовых заимствований прочно укоренилась и начала приносить свои плоды в деятельности организаций высшего профессионального образования. При этом немногие вузы задумываются над технологией проведения проверок, и уж тем более далеко не все учреждения озадачиваются тем, что такие проверки проводятся путём передачи документа или его текстового представления по незащищённому каналу связи в сеть Интернет.
В настоящее время в вузах студенты, аспиранты и научные сотрудники проводят по-настоящему значимые исследования, опыты или эксперименты. И зачастую материалы, полученные в результате их труда, стоят на пороге открытий и имеют реальную научную ценность. Согласны ли вузы в таком ключе на то, чтобы данные исследований, проходя проверку на плагиат, оказались в руках третьих лиц?
Законодательство обязало проверять — вузы исполняют. Но как обезопасить научные труды и квалификационные работы от передачи третьей стороне, что неизбежно происходит, когда документ попадает в сеть Интернет?
Система «РУКОНТекст» представила решение данного вопроса путём поставки локальной версии сервиса и установления защищённого канала связи с основной системой.
Такая проверка на заимствования проходит одновременно по локальным коллекциям вуза и полному набору коллекций системы, а её результат формируется на сервере пользователя, что обеспечивает полную конфиденциальность.
Архитектура предлагаемого решения представлена на рис. 1. Предполагается, что у пользователя развёрнут локальный «РУКОНТекст» на одном сервере.
Рис. 1 Схема взаимодействия локального «РУКОНТекста»
с основной системой
На рисунке изображён процесс использования основных функций системы пользователем, для которого нет принципиального различия между локальными коллекциями и внешними.
Программные модули, реализующие функции (сервисы), отправляют запрос локальному индексатору и параллельно с этим к основной системе. На стороне «РУКОНТекста» запросы принимает специальный прокси-модуль, который перенаправляет их всем индексаторам и агрегирует результаты. После выполнения запроса в локальных и внешних индексаторах результаты объединяются на сервере пользователя и формируется отчёт о проверке. Работа с возвращёнными документами для пользователя является совершенно прозрачной, потому что все стандартные функции системы (получение ключевых слов, автоматическое реферирование, поиск похожих) работают по вышеуказанной схеме.
Если говорить о защищённом соединении с внешней системой, то стоит обратиться к следующей схеме предоставления функций поиска, поиска заимствований и т.д. по защищённому каналу, представленной на рис. 2.
Рис. 2 Схема соединения по защищённому каналу
Схема изображает процесс использования функций системы локальным пользователем. Загруженные им данные (документ или поисковый запрос) преобразуются во внутреннее представление на локальном сервере (шаг 3 на рисунке). После этого устанавливается защищённое соединение с модулем основной системы (шаг 4). Для шифрования трафика применяется протокол TLS 1.2. Аутентификация производится с помощью набора самоподписанных сертификатов. Стоит отметить: даже с учётом того, что на серверах «РУКОНТекста» находятся ключи, с помощью которых подписывались сертификаты, невозможно расшифровать захваченный трафик, идущий между клиентом и сервером. Это достигается благодаря использованию алгоритма DHE (эфемерный Диффи — Хеллман), который является улучшенной версией стандартного алгоритма обмена секретным ключом по незащищённому каналу связи. Главное отличие DHE в том, что ключ сервера не используется в процессе установления соединения. Вместо него для каждой новой сессии генерируются секретный и публичный ключи, которые находятся только в оперативной памяти сервера и после установления соединения уничтожаются. Таким образом, при наличии записанного трафика сессии и главного ключа сервера становится невозможным дешифровать переданные данные. Весь трафик на стороне основной системы также шифруется с помощью вышеуказанного протокола (шаг 5 на рисунке).
Работая по указанным принципам, локальная версия позволяет провести качественную проверку в отсутствие риска того, что материалы или даже сам факт проверки будут переданы третьей стороне.
Устанавливая локальную версию системы «РУКОНТекст», помимо функции проверки на заимствования пользователь получает доступ к дополнительным возможностям системы, а именно:
· семантическому поиску;
· поиску тематически похожих документов;
· списку ключевых слов документа;
· построению расширенной аннотации;
· тематическому анализу;
· анализу качества текстов.
Все эти функции работают в локальной версии системы, предоставляя пользователю широкий спектр аналитических возможностей. При этом сохраняется право работы со всеми функциями веб-версии «РУКОНТекста» через Интернет.
Многие организации опробовали систему, проверяя документы по защищённым каналам связи, и уже имеют положительный опыт работы с локальной версией системы «РУКОНТекст».
С одной стороны, в вузах могут создаваться работы, которые содержат сведения, относящиеся к государственной тайне. А с другой — есть работы, в которых описываются оригинальные исследования, содержатся ценная с научной точки зрения информация или персональные данные. Если вузы не обязаны проверять первые, то все остальные — должны.
Но важно отметить, что практика проведения проверок на плагиат показала всю значимость данной процедуры и её положительное влияние на качество научных и квалификационных работ. Так разумно ли пренебрегать возможностью проверить любые материалы, не опасаясь за их конфиденциальность?
Авторы: Евгений ФОМИН, директор по развитию ООО «НЦР «Руконт»; Денис ЗУБАРЕВ, инженер-исследователь ФИЦ ИУ РАН; Эльвира САПАРОВА, редактор-корреспондент
Рубрика: Инновационные технологии
Год: 2018
Месяц: Октябрь