Книжный рынок и издательства   Библиотеки   Образование
и наука
  Конкурс
“Университетская книга”

Ноябрь 2021
"Книжный Ренессанс: эволюция бизнес-моделей"

  • Павел КУЗЬМИН: "Иностранка" должна идти своим путём
  • Книжный рынок: время инноваций
  • Образование для креативной экономики
  • Библиотечные фонды: проблемы и решения



МультиВход

Интервью

Книжный рынок

Вузовские издательства

Искусство издавать

Библиотеки

Образование

Инновационные технологии

Электронные библиотеки

Культура книги

Библиогеография

Библиотехнологии

Выставки и конференции

Конкурсы и премии

Документы

Copyright.ru

КНИГА+

Год литературы

Журнал Онлайн



 

samiy-chitayuschiy-region


 

rgdb-podari-rebenku


Рассылка


Проблема оценки оригинальности в учебных и научных работах
16.04.2021 00:00

Начиная с 2015 г. активно развиваются системы поиска заимствований в дипломных и курсовых работах, научных статьях и диссертациях. Главным вектором их развития до недавнего времени считалось расширение баз проиндексированных документов (индексов).

Однако с ростом объёма индексов возникает ряд проблем. Рассмотрим ситуацию на примере системы «РУКОНТЕКСТ».

Постоянное усовершенствование механизмов хранения и снижение стоимости хранения единицы информации, инвестирование в ИТ привели к возможности хранить на серверах «РУКОНТЕКСТа» порядка 2 млрд документов. Динамика роста индексной базы представлена на рис. 1.

problemy-otsenki-1-2

Вследствие роста индексной базы меняются и другие показатели, в частности количество проверенных документов (рис. 2), средняя оригинальность результатов проверок (рис. 3) и число попыток обхода системы (рис. 4).

problemy-otsenki-3-4

Проверенным считается документ, загруженный в систему поиска заимствований, в результате чего был вычислен показатель оригинальности — процент текста, не обнаруженного в индексной базе как часть других документов.

Средней оригинальностью будем считать среднее значение результатов проверок, вычисленное за приведённый период.

Попыткой обхода системы называется внесение в документ изменений с целью искусственного завышения показателя оригинальности. На данный момент известны следующие основные типы попыток обхода:

·         замена букв в тексте буквами алфавита другого языка, имеющими аналогичное написание;

·         вставка невидимых символов;

·         вставка специальных символов (в основном служебных).

Анализ приведённых графиков позволяет говорить о взаимной корреляции между рассмотренными показателями.

Очевидно, что при оценке оригинальности и наличии попыток обхода проблема принятия окончательного решения всегда остаётся за экспертом.

Одновременно со снижением среднего процента оригинальности как следствие роста индексных баз увеличивается число обнаруженных заимствований. Этот рост продолжается, и анализировать результаты проверки становится всё сложнее.

Таким образом, актуальной задачей в развитии систем поиска заимствований является усовершенствование инструментов работы экспертов.

В настоящее время в системе «РУКОНТЕКСТ» представлен наглядный и удобный интерфейс для работы с результатом проверки. Ведётся разработка помощника в классификации заимствований. Будет внедрена функция автоматической классификации заимствований как общеизвестных фактов. Для этого происходит обучение нейронной сети и ведётся поиск параметров, позволяющих с высокой точностью классифицировать фрагмент как общеизвестный факт и исключить его из расчёта.

Генеральный директор ООО «НЦР «РУКОНТ» Денис Леонидович СЕМЁНОВ

Опубликовано в номере март 2021

 



telegram-1-1
 
Какие форматы доступа на электронную периодику для вас наиболее интересны?
 

 

    rks20 


 


webbanner-08-video

 

 webbanner-07-nacproekt

 

 webbanner-01-neb

 

 webbanner-02-fz-o-kulture

 

webbanner-red-03-ebs

 

webbanner-red-04-kn-rynok

 

 webbanner-red-05period-pechat

 

 webbanner-red-06-ros-poligrafiya

 

webbanner-red-kult

 
Copyright © ООО Издательский дом "Университетская книга" 2011
Все права защищены.
Студия Web-diamond.ru
разработка сайтов и интернет-магазинов.