«РУКОНТекст»: конфиденциальная проверка на заимствования

Практика проверок выпускных квалификационных работ и научных трудов на наличие текстовых заимствований прочно укоренилась и начала приносить свои плоды в деятельности организаций высшего профессионального образования. При этом немногие вузы задумываются над технологией проведения проверок, и уж тем более далеко не все учреждения озадачиваются тем, что такие проверки проводятся путём передачи документа или его текстового представления по незащищённому каналу связи в сеть Интернет.

В настоящее время в вузах студенты, аспиранты и научные сотрудники проводят по-настоящему значимые исследования, опыты или эксперименты. И зачастую материалы, полученные в результате их труда, стоят на пороге открытий и имеют реальную научную ценность. Согласны ли вузы в таком ключе на то, чтобы данные исследований, проходя проверку на плагиат, оказались в руках третьих лиц?

Законодательство обязало проверять — вузы исполняют. Но как обезопасить научные труды и квалификационные работы от передачи третьей стороне, что неизбежно происходит, когда документ попадает в сеть Интернет?

Система «РУКОНТекст» представила решение данного вопроса путём поставки локальной версии сервиса и установления защищённого канала связи с основной системой.

Такая проверка на заимствования проходит одновременно по локальным коллекциям вуза и полному набору коллекций системы, а её результат формируется на сервере пользователя, что обеспечивает полную конфиденциальность.

Архитектура предлагаемого решения представлена на рис. 1. Предполагается, что у пользователя развёрнут локальный «РУКОНТекст» на одном сервере.

rukontekst-1


Рис. 1 Схема взаимодействия локального «РУКОНТекста» с основной системой

На рисунке изображён процесс использования основных функций системы пользователем, для которого нет принципиального различия между локальными коллекциями и внешними.

Программные модули, реализующие функции (сервисы), отправляют запрос локальному индексатору и параллельно с этим к основной системе. На стороне «РУКОНТекста» запросы принимает специальный прокси-модуль, который перенаправляет их всем индексаторам и агрегирует результаты. После выполнения запроса в локальных и внешних индексаторах результаты объединяются на сервере пользователя и формируется отчёт о проверке. Работа с возвращёнными документами для пользователя является совершенно прозрачной, потому что все стандартные функции системы (получение ключевых слов, автоматическое реферирование, поиск похожих) работают по вышеуказанной схеме.

Если говорить о защищённом соединении с внешней системой, то стоит обратиться к следующей схеме предоставления функций поиска, поиска заимствований и т.д. по защищённому каналу, представленной на рис. 2.

rukontekst-2


Рис. 2 Схема соединения по защищённому каналу

Схема изображает процесс использования функций системы локальным пользователем. Загруженные им данные (документ или поисковый запрос) преобразуются во внутреннее представление на локальном сервере (шаг 3 на рисунке). После этого устанавливается защищённое соединение с модулем основной системы (шаг 4). Для шифрования трафика применяется протокол TLS 1.2. Аутентификация производится с помощью набора самоподписанных сертификатов. Стоит отметить: даже с учётом того, что на серверах «РУКОНТекста» находятся ключи, с помощью которых подписывались сертификаты, невозможно расшифровать захваченный трафик, идущий между клиентом и сервером. Это достигается благодаря использованию алгоритма DHE (эфемерный Диффи — Хеллман), который является улучшенной версией стандартного алгоритма обмена секретным ключом по незащищённому каналу связи. Главное отличие DHE в том, что ключ сервера не используется в процессе установления соединения. Вместо него для каждой новой сессии генерируются секретный и публичный ключи, которые находятся только в оперативной памяти сервера и после установления соединения уничтожаются. Таким образом, при наличии записанного трафика сессии и главного ключа сервера становится невозможным дешифровать переданные данные. Весь трафик на стороне основной системы также шифруется с помощью вышеуказанного протокола (шаг 5 на рисунке).

Работая по указанным принципам, локальная версия позволяет провести качественную проверку в отсутствие риска того, что материалы или даже сам факт проверки будут переданы третьей стороне.

Устанавливая локальную версию системы «РУКОНТекст», помимо функции проверки на заимствования пользователь получает доступ к дополнительным возможностям системы, а именно:

·         семантическому поиску;

·         поиску тематически похожих документов;

·         списку ключевых слов документа;

·         построению расширенной аннотации;

·         тематическому анализу;

·         анализу качества текстов.

Все эти функции работают в локальной версии системы, предоставляя пользователю широкий спектр аналитических возможностей. При этом сохраняется право работы со всеми функциями веб-версии «РУКОНТекста» через Интернет.

Многие организации опробовали систему, проверяя документы по защищённым каналам связи, и уже имеют положительный опыт работы с локальной версией системы «РУКОНТекст».

С одной стороны, в вузах могут создаваться работы, которые содержат сведения, относящиеся к государственной тайне. А с другой — есть работы, в которых описываются оригинальные исследования, содержатся ценная с научной точки зрения информация или персональные данные. Если вузы не обязаны проверять первые, то все остальные — должны.

Но важно отметить, что практика проведения проверок на плагиат показала всю значимость данной процедуры и её положительное влияние на качество научных и квалификационных работ. Так разумно ли пренебрегать возможностью проверить любые материалы, не опасаясь за их конфиденциальность?

Авторы: Евгений ФОМИН, директор по развитию ООО «НЦР «Руконт»; Денис ЗУБАРЕВ, инженер-исследователь ФИЦ ИУ РАН; Эльвира САПАРОВА, редактор-корреспондент


Рубрика: Инновационные технологии

Год: 2018

Месяц: Октябрь

Теги: Евгений Фомин Денис Зубарев Эльвира Сапарова