Отграничение криминалистики от иных наук методами информационного анализа текста. К. В. Бугаев Источник icon

Отграничение криминалистики от иных наук методами информационного анализа текста. К. В. Бугаев Источник



НазваниеОтграничение криминалистики от иных наук методами информационного анализа текста. К. В. Бугаев Источник
Дата конвертации20.05.2012
Размер208.78 Kb.
ТипДокументы


ОТГРАНИЧЕНИЕ КРИМИНАЛИСТИКИ ОТ ИНЫХ НАУК

МЕТОДАМИ ИНФОРМАЦИОННОГО АНАЛИЗА ТЕКСТА.


К.В. Бугаев


Источник: сайт «Криминалистика и Судебная экспертиза» http://kbugaev.narod.ru/


DEMARCATION OF CRIMINALISTICS BY METHODS

THE INFORMATION ANALYSIS OF THE TEXT

K.V. Bugaev


Бугаев Константин Валериевич, доцент кафедры уголовного процесса и криминалистики Факультета права и экономики Омской академии МВД России, кандидат юридических наук.

The candidate of jurisprudence (PhD), Omsk academy of the Ministry of Internal Affairs of Russia. The associate professor of chair of criminal trial and criminalistics.


Для выделения тематически близких к криминалистике дисциплин из ряда иных наук, возможно использовать методы информационного анализ текста, применяя названия авторефератов диссертаций (АРД). Так установлена близость к криминалистике ряда юридических наук «криминального блока» по некоторым аспектам рядов динамики количества тем АРД, дескрипторов, информационной плотности названий АРД.

^ Ключевые слова. Криминалистика, наукометрия, информация, методы анализа текста, семантика, дескриптор, статистика, информационная плотность текста.


For demarcation of criminalistics from other sciences it is possible to use the information analysis of texts of names (headings) of author's abstracts of dissertations. Quantitative methods find out affinity to criminalistics of some legal sciences on parameters: dynamics of quantity of author's abstracts of dissertations, descriptors, information density of names of texts.

Keywords. Criminalistics, Scientometrics, the information, methods of the analysis of the text, semantics, a descriptor, statistics, information density of the text.


^ Опубликовано: Юридический мир №8(176), 2011

Развитие любой науки начинается, прежде всего, с осознания научным сообществом, что определенная область научного знания существует как реальность – т.е. она достаточно обширная, методологически зрелая, имеет развитую теоретическую базу. При этом часто возникает и проблема разграничения наук1, особенно смежных. Данную проблему возможно решать различными методами – например, посредством использования в качестве критерия различия в объекте, предмете исследования, целях и задачах научной области, методах исследования и т.д.
Но, кроме того, возможно использовать и методы информационного анализа текста, которые широко применяются в науковедении. Так, В.В. Нали­мов и 3.М. Мульченко пишут: «Особый интерес представляет статистическое изуче­ние языка научных публикаций... Такой анализ позволяет оценить не только ши­роту, но и глубину проникновения новых идей и методов. Последняя будет задаваться частотой появления слов, которыми кодируются сложные концепции. Этим спосо­бом, видимо, удастся следить и за развитием отдельных идей или научных школ в пределах одной области знаний»2. С.Д. Хайтун поясняет: «В числе наукометрических оказываются: стати­стический метод (измерители – число открытий, число журналов, число организаций, число премий, число ученых, частота соавтор­ства и некоторые другие); метод подсчета числа публикаций (измеритель – число научных продуктов); цитат-индекс (измери­тель – число ссылок); контент–анализ (измеритель – число так называемых символов); тезаурусный метод (измеритель – число терминов); сленговый метод (измеритель – число так называемых сленговых слов)»3. А.И. Яблонский указывает: «Представляя собой дискретный на­бор текстов, массив публикаций поддается количественному описанию и отражает в определенном смысле эффективность научной деятельности. Поэтому информационный массив до сих пор остается – при всех недостатках – наиболее под­ходящим «измерителем» научного выхода»4.

Криминалистика, имея обширные междисциплинарные связи, также, на наш взгляд, нуждается в более четком определении современного состояния её развития, установлении близких научных областей и степени такой близости, нахождении границ её интересов – Е.П. Ищенко совершенно справедливо полагает: «Современное состояние отечественной криминалистики нуждается в научном ос­мыслении, поскольку это позволит не только обозначить достигнутые успехи, но и ука­зать на имеющиеся недоработки, глубже понять тенденции ее развития»5.

Попытаемся изучить массив публикаций отечественной криминалистики, который ограничим названиями авторефератов диссертаций (АРД), что достаточно адекватно отражает главное направление работы конкретного автора, и в целом позволит охватить весь спектр интересов научного сообщества данной предметной области за весь доступный для изучения временной интервал. Данное исследование проведем в сравнении с аналогичными параметрами иных научных областей. Нашей целью является, таким образом, отграничение криминалистки от иных дисциплин методами информационно-количественного анализа текста, что достигается решением задач нахождения индикаторов такого отграничения.

Для целей исследования был произведен отбор доступных для изучения массивов данных об авторефератах диссертаций из каталогов Российской Государственной библиотеки с распределением их по годам начиная с 1986 по 2010 гг. Принципы отбора дисциплин для сравнительного анализа с криминалистикой следующие: во-первых – необходимо исследовать близкие к криминалистике отрасли юридического знания – уголовный процесс6, уголовное право, криминология, уголовно-исполнительное право; во-вторых – целесообразно изучить и отдаленные от криминалистики по своим принципам и научным подходам дисциплины из области технических и медицинских наук; и в-третьих полезно провести сравнительный анализ криминалистики и с абсолютно иной по своим подходам сферой – например, с искусствоведением (области технических, медицинских наук и искусствоведения подбирались по принципу сопоставимости количества АРД за исследуемый период, хотя, разумеется, можно попытаться выбрать области гипотетически более «близкие» или, напротив, «далекие» от криминалистики7. Однако, мы исходим из предположения, что образ мышления ученых, методология научного творчества, и, соответственно, принципы построения названий научных работ и организация их текстов у близких дисциплин сходны). Результаты подбора дисциплин и количества АРД – см. таблицу 1.

Таблица 1. Количество исследованных АРД.

Дисциплина

Количество изученных АРД

(единиц)

Криминалистика. 12.00.09 – в дальнейшем обозначается КТ

1737

Уголовный процесс. 12.00.09 – в дальнейшем обозначается УПр

1549

Уголовное право и криминология; уголовно–исполнительное право.

12.00.08 – в дальнейшем обозначается УПиК

4220

Техника. Строительные материалы и изделия. 05.23.05 – в дальнейшем обозначается Тхн

2045

Медицина. Инфекционные болезни. 14.00.10 – в дальнейшем обозначается Мдц

1274

Искусствоведение. Музыкальное искусство. 17.00.02 – в дальнейшем обозначается Иск

1767


Прежде всего, нами проводилось исследование соотношения семантической близости названий АРД по криминалистике с другими дисциплинами8. Результаты отражены в таблице 2.

Таблица 2. Соотношение семантической близости (идентичности9) названий АРД по криминалистике с другими дисциплинами.




УПр

УПиК

Тхн

Мдц

Иск


Лемматизация проводилась10

91%

91%

52%

50%

53%

Лемматизация не проводилась

80%

77%

35%

36%

37%

Мы наблюдаем, что юридические науки оказались заметно более близкими к криминалистике по изучаемому параметру. При этом интересно отметить, что отсутствие при исследовании лемматизации несколько снижает показатели сходства дисциплин, что, видимо, объясняется специфическим употреблением морфологических форм слов в каждой науке.

В продолжении данного исследования нами проведено изучение соотношение идентичности дескрипторов11 названий АРД по криминалистике с другими дисциплинами. Результаты отражены в таблице 3.

Таблица 3. Соотношение семантической близости дескрипторов названий АРД по криминалистике с другими дисциплинами.




УПр

УПиК

Тхн

Мдц

Иск


Лемматизация проводилась

75%

77%

19%

22%

21%

Лемматизация не проводилась

60%

56%

12%

14%

13%

Мы наблюдаем, что тенденции, указанные нами выше при изучении соотношения идентичности названий АРД, также сохраняются.

Следовательно, анализ идентичности названий АРД и их дескрипторов по различным наукам может служить индикатором для выделения тематически близких дисциплин. Однако, уверенное разделение с помощью данного индикатора близких наук остается проблематичным.

Далее, нами проводился анализ количества тем АРД а также дескрипторов (динамика по годам). Результаты отражены в таблицах 4 и 5.

Таблица 4. Статистические показатели рядов динамики количества тем АРД.

Дисциплина

Дисперсия выборки

Среднеквад–ратичное отклонение

Медиана

Мода

Среднее значение

Эксцесс

Асимметрия относительно среднего

Корреляция исследуемых данных

по КТ с…

КТ

3412,332

58,41517

53

27

72,375

–1,27355

0,386228




УПр

2783,911

52,76278

48,5

22

64,54167

–1,10912

0,61231

0,909475

УПиК

19083,19

138,1419

119,5

нет данных

175,8333

–1,18132

0,516566

0,967851

Тхн

701,9167

26,49371

84

89

81,8

1,670209

0,204747

–0,01855

Мдц

606,3733

24,62465

56

62

50,96

–0,29077

–0,33217

0,093864

Иск

558,2267

23,62682

74

64

70,68

1,822962

–0,74731

0,064069


Таблица 5. Статистические показатели рядов динамики дескрипторов названий АРД.

Дисциплина

Дисперсия выборки

Среднеквад–ратичное отклонение

Медиана

Мода

Среднее значение

Эксцесс

Асимметрия относительно среднего

Корреляция исследуемых данных

по КТ с…

КТ

2592,926

50,92079

44,5

19

60,45455

–1,5945

0,348927




УПр

1943,419

44,08423

38

3

46,34783

–1,1593

1,194564

0,885274

УПиК

11986,54

109,4831

94

нет данных

137,2174

–1,3452

0,463453

0,952286

Тхн

481,7067

21,94782

50

42

47,04

1,178481

0,285607

–0,12275

Мдц

799,9112

28,2827

64

73

61,20833

–0,10775

–0,13076

0,098991

Иск

313,8841

17,71677

52,5

47

52,33333

3,4476

0,069545

–0,20973

Анализ данных из таблиц 4 и 5 дает возможность выделить из общего ряда юридические дисциплины на основании показателей эксцесса12 и корреляции динамики количества работ. Указанные индикаторы достаточно отчетливо выделяют юридические науки и могут служить соответствующими индикаторами. В какой-то степени отличие данных по юридическим дисциплинам выражено и в показателях дисперсии13 (что, видимо, указывает на относительно больший тематический разброс названий в юридических науках вообще) и, из данных таблицы 4, также асимметрии относительно среднего14. В то же время, разница внутри юридических дисциплин по данным параметрам несущественна.

Изучалось также количество дескрипторов на одну работу по каждому году (информационная плотность) – результаты см. таблицу 6.

Таблица 6. Статистические показатели рядов динамики количества дескрипторов, приходящихся на одну работу.

Дисциплина

Дисперсия выборки

Среднеквад–ратичное отклонение

Медиана

Мода

Среднее значение

Эксцесс

Асимметрия относительно среднего

Корреляция исследуемых данных

по КТ с…

КТ

0,030145

0,173624

0,710548

нет данных

0,668017

–1,18297

–0,44635




УПр

0,101596

0,318741

0,768595

0,25

0,589436

–1,89694

–0,16895

0,665509

УПиК

0,032715

0,180873

0,789286

нет данных

0,749059

5,97187

–2,2755

0,305156

Тхн

0,028982

0,170241

0,649485

нет данных

0,628979

5,537565

–2,17317

–0,16989

Мдц

0,095691

0,309339

1,278495

нет данных

1,284258

6,371695

–1,15762

0,286647

Иск

0,009479

0,097358

0,786592

нет данных

0,79344

1,719302

0,66268

–0,28935

Анализ этих данных показывает близость криминалистики и уголовного процесса по параметрам «эксцесс» и «асимметрия относительно среднего» – следовательно, данные индикаторы могут служить для выделения весьма близких дисциплин (обе эти науки относятся к одной научной специальности 12.00.09). Иных отчетливо выраженных индикаторов не наблюдается.

Исследовалась корреляции количества слов в названии АРД по криминалистике с другими науками15 – см. таблицу 7 и график 1.

Таблица 7. Корреляции количества слов в названии АРД по криминалистике с другими науками.

Дисциплина

УПр


УПиК

Тхн

Мдц

Иск

Корреляция исследуемых данных по КТ с…

0,981

0,969

0,925

0,975

0,815


График 1. График корреляции количества слов в названии АРД по криминалистике с другими науками.




Анализ данных таблицы 7 и графика 1 приводит нас к следующему: а) различия в предметных областях наблюдаются во 2-м знаке после запятой; б) четкого выделения юридических наук по данному параметру не наблюдается ввиду близости криминалистики не только с ними, но и с техникой (видимо здесь, в том числе, отражается близость криминалистики с техническими дисциплинами).

Таким образом, результаты нашего исследования позволяют прийти к следующим выводам:

  1. Выделение тематически близких наук (в нашем случае – дисциплин «криминального блока», близких к криминалистике) из ряда иных осуществимо методами информационного анализа названий авторефератов диссертаций;

  2. При этом возможно применять следующие индикаторы:

– семантическая близость названий авторефератов диссертаций;

– эксцесс и корреляция динамики количества работ, а также дисперсия выборки и асимметрия относительно среднего – при анализе динамики количества тем авторефератов диссертаций и их дескрипторов;

  1. Индикаторы «эксцесс» и «асимметрия относительно среднего» могут служить для выделения весьма близких дисциплин (в нашем случае криминалистики и уголовного процесса) из ряда иных наук – при изучении динамики количества дескрипторов на одну работу (информационной плотности текста названий АРД);

  2. Индикатор корреляции количества слов в названии авторефератов диссертаций показывает близкие к криминалистике дисциплины с более широким их охватом (в частности не только юридические науки криминального блока, но и технические).

  3. Кроме того, проведенный информационный анализ текста названий авторефератов диссертаций подтверждает тезис о том, что криминалистика по исследуемым параметрам относится к юридическим дисциплинам, но имеет и некоторую техническую компоненту.

Полагаем, что только применение выявленных индикаторов в их совокупности позволит выделять различные науки из ряда иных дисциплин. Поиск индикаторов для отграничения криминалистики от существенно близких к ней наук (в рамках научной специальности 12.00.09) методами анализа текстов требует, очевидно, более глубоких исследований. Считаем, также, что информационный анализ текстов – весьма интересное и перспективное направление исследований, позволяющее оценивать положение дел в изучаемой дисциплине достаточно точными методами математической статистики.


Примечания

1 Проблему разграничения наук К.Поппер называл демаркацией – см. Поппер К. Логика научного исследования: Пер. с англ. / Под общ. ред. В.Н. Садовского. – М.: Республика, 2004, С.30.


2 См.: Нали­мов В.В., Мульченко 3.М. Наукометрия. Изучение развития науки как информационного процесса. Физико-математическая библиотека инженера. Изд. «Наука», Главн. ред. физ.-мат. литер., 1969, С.15.


3 См.: Хайтун С.Д. Наукометрия. Состояние и перспективы. – М.: Изд. «Наука», 1983, С.8.


4 См.: Яблонский А.И. Модели и методы исследования науки. – М.: Эдиториал УРСС, 2001, С.63.


5 См.: Ищенко Е.П. Российская криминалистика сегодня // Вестник криминалистики / Отв. ред. А.Г. Филиппов. Вып. 4 (20). – М.: Спарк. – 2006, С.4.


6 Анализировались названия трудов в рамках специальности 12.00.09. При этом к работам по криминалистике нами относились те, которые имеют техническую и тактическую компоненту в названии и значимы с точки зрения методики расследования преступлений. Теория оперативно-розыскной деятельности нами не рассматривалась по той причине, что большая часть работ по данной дисциплине носит закрытый характер.


7 При этом определение степени «близости» или «отдаленности» дисциплин составляет отдельную непростую задачу.


8 Для анализа текстов здесь и далее использовались компьютерные программы: для выделения дескрипторов из текста – TextAnalyst v.2.01; для сравнения идентичности текстов – Shingles Expert v.1.1.


9 В данном и аналогичных следующих ниже по тексту случаях имеется в виду степень сходства. Термин «идентичность» употребляется в смысле программы Shingles Expert.


10 Лемматиза́ция – процесс привода словоформы к лемме – её нормальной (словарной) форме. В русском языке нормальными формами считаются следующие морфологические формы: для существительных – именительный падеж, единственное число; для прилагательных – именительный падеж, единственное число, мужской род; для глаголов, причастий, деепричастий – глагол в инфинитиве.


11 Здесь и далее: дескри́птор – лексическая единица (слово, словосочетание) языка, выражающая основное смысловое содержание какого-либо текста.


12 Эксцесс характеризует относительную остроконечность или сглаженность распределения по сравнению с нормальным распределением. Положительный эксцесс обозначает относительно остроконечное распределение. Отрицательный эксцесс обозначает относительно сглаженное распределение.


13 Дисперсия – в математической статистике и теории вероятностей, мера рассеивания (отклонения от среднего).


14 Асимметрия характеризует степень несимметричности распределения относительно его среднего. Положительная асимметрия указывает на отклонение распределения в сторону положительных значений. Отрицательная асимметрия указывает на отклонение распределения в сторону отрицательных значений.


15 Количество слов в названии АРД определялось с помощью программы статистического анализа текста «Shtampomer» V. 1.0.







Похожие:

Отграничение криминалистики от иных наук методами информационного анализа текста. К. В. Бугаев Источник iconТема: виды редакторского чтения текста
В основе редакторского анализа текста лежит его чтение. Редактору при работе с текстом приходится несколько раз прочитать его, каждый...
Отграничение криминалистики от иных наук методами информационного анализа текста. К. В. Бугаев Источник iconБугаев К. В., кандидат юридических наук
О понятии технико–криминалистического обеспечения раскрытия и расследования преступлений
Отграничение криминалистики от иных наук методами информационного анализа текста. К. В. Бугаев Источник iconМеханизмы и стратегии понимания и перевода иноязычного текста (на материале анализа вариантов перевода научно-популярного текста на английском языке)
...
Отграничение криминалистики от иных наук методами информационного анализа текста. К. В. Бугаев Источник iconДокументы
1. /Боцула Валерий/Источник 1/Гриппом можно не болеть никогда (ред.).doc
2. /Боцула...

Отграничение криминалистики от иных наук методами информационного анализа текста. К. В. Бугаев Источник iconСтадия возбуждения уголовного дела: «за» и «против»
Е. А. Карякин, кандидат юридических наук, зав кафедрой криминалистики Оренбургского государственного университета
Отграничение криминалистики от иных наук методами информационного анализа текста. К. В. Бугаев Источник iconМетодология криминалистического прогнозирования (на примере экспертных подразделений овд)
Доцент кафедры уголовного процесса и криминалистики Омской академии мвд россии, Факультет права и экономики, кандидат юридических...
Отграничение криминалистики от иных наук методами информационного анализа текста. К. В. Бугаев Источник iconПроблемы юридической терминологии (на примере криминалистики и судебной экспертизы) Опубликовано
Указанное проиллюстрировано примерами из понятийного аппарата криминалистики и судебной экспертизы
Отграничение криминалистики от иных наук методами информационного анализа текста. К. В. Бугаев Источник iconБугаев Константин Валериевич канд юрид наук Опубликовано с небольшой редакторской правкой нижеизложенный текст опубликован в: Совершенствование следственной и экспертной практики: тезисы
Некоторые меры регионального уровня по противодействию злоупотреблению наркотиками
Отграничение криминалистики от иных наук методами информационного анализа текста. К. В. Бугаев Источник iconДокументы
1. /ПЛАН КОМПЛЕКСНОГО АНАЛИЗА ТЕКСТА.doc
Отграничение криминалистики от иных наук методами информационного анализа текста. К. В. Бугаев Источник iconДокументы
1. /Ионова С.В. Основные принципы содержательно-тематического анализа текста.doc
Разместите кнопку на своём сайте:
Документы


База данных защищена авторским правом ©podelise.ru 2000-2014
При копировании материала обязательно указание активной ссылки открытой для индексации.
обратиться к администрации
Документы

Разработка сайта — Веб студия Адаманов