• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
vision

Иван Стерлигов, Татьяна Ходжер. Взгляд на науку через призму соло-статей

Соло-статьи – так для краткости мы называем публикации с одним автором – интереснейший объект для наукометрического анализа, позволяющий воочию наблюдать тектонические изменения в организации труда и научной коллаборации, происходящие в последние десятилетия.

Помимо важности для науковедения соло-статьи еще и крайне удобны для изучения в техническом плане: во-первых, при работе с ними снимается важнейшая проблема оценки сравнительного вклада соавторов. Во-вторых, сильно упрощается анализ аффилиаций, т.е. указанных в статьях мест работы: так, в Web of Science связи авторов и аффилиаций начали фиксироваться только с 2009 года, а в записях о более ранних публикациях таких связей нет.

Естественно, все это дается дорогой ценой. В современной науке работа без соавторов – штука совсем нетипичная и в общем уходит в прошлое, а распределение соответствующих статей по тематикам крайне неравномерно: в целом ряде наук многие вещи в одиночку просто не сделать. Тем не менее взглянуть на соло-статьи очень любопытно и полезно, особенно в динамике по разным странам и областям науки. В настоящей заметке мы как раз и сделаем такую попытку.

Но обо всем по порядку. Прежде всего об инструментарии: современные аналитические надстройки InCites (работает на данных Web of Science) и SciVal (использует Scopus), доступные всем сотрудникам НИУ ВШЭ, позволяют фильтровать публикации с одним соавтором относительно легко. Правда, в обеих базах встречаются сбои. Например, в выгруженном из InCites\WoS массиве есть статьи, у которых базой проиндексирован только один, обычно первый автор, а на деле их может быть сотня. Есть и серьезные расхождения между двумя источниками, о них чуть ниже.

Для начала мы посмотрели на изменение общей картины на горизонте нескольких десятилетий, благо в InCites есть данные с 1980 года (в SciVal с 1996-го) На рисунке 1 мы видим, что быстрое снижение доли соло-статей характерно для всех без исключения разделов науки. Естественные, технические, медицинские и сельскохозяйственные науки ныне почти не генерируют соло-статьи, их порядка 5%, а скоро будет еще меньше. В общественных науках ситуация, казалось бы, стабилизировалась в 2000-е, но в последние годы падение резко ускорилось, и теперь соло-статей там меньше трети вместо почти 70% в 1980 году.

 

Последним оплотом авторов-одиночек предсказуемо являются гуманитарные области знания, однако тут мы неожиданно видим огромный разрыв между данными Web of Science и Scopus (примечательно, что для пяти других разделов науки значимых расхождений нет). Классификатор в InCites и SciVal нами использован один и тот же – стандартный OECD Fields of Science. По нашей гипотезе, дело в том, что в Scopus в гуманитарные науки в больших количествах попадают статьи из наук естественных и общественных. Это связано с тем, что в данной базе гораздо выше доля журналов, которые приписаны сразу ко многим областям науки, а тематика отдельных публикаций и в WoS, и в Scopus до сих пор определяется тематикой журнала. Иными словами, если журнал приписан к биологии, физике, химии и истории, то каждая статья в нем будет приписана сразу ко всем этим областям, и это будет учитываться в расчете нормализованного по областям цитирования, ключевой на сегодня продвинутой метрике научного вклада. В целом такие разночтения еще раз подчеркивают огромную значимость классификаторов и внутренних механизмов баз даных в наукометрии.

Рисунок 1.
Динамика изменения % статей (articles) с одним автором среди всех статей по шести укрупненным группам наук, InCites (Web of Science SCIE, SSCI, A&HCI, BKCI), 1980-2016. Классификатор OECD Fields of Science. 


Еще важнее, что представленные данные подтверждают громкие слова про окончательный конец эпохи одиночек в естественных науках, фактически определявших развитие этих наук до середины XX века. Сейчас даже теоретики публикуются чаще в соавторстве: в математике доля соло-статей упала с 40% в 1996 году до 16,7% в 2017 году (по данным SciVal, здесь и далее данные по 2017 году на 7 ноября). Резко снизилась доля соло-статей и в специальном высокоцитируемом жанре научного обзора (review): с почти 50% в 1980-м до 10% в 2016 году (по данным InCites).

Но серьезные различия есть не только по дисциплинам, но и по странам: в России та же самая доля математических соло-статей падает гораздо медленнее, чем в среднем, – с 45% до 31,4% за тот же срок, Перельманы все никак не переведутся. Поэтому мы посмотрели на соответствующие показатели для России в сравнении с ведущими научными игроками мира – США, Германией, Китаем и Японией. Рисунки 2-3 показывают соответствующую динамику для естественных и общественных наук. 


Рисунок 2. Динамика изменения % статей (articles) с одним автором среди всех статей по естественным наукам, SciVal, 1996-2017. 



Рисунок 3. Динамика изменения % статей (articles) с одним автором среди всех статей по общественным наукам, SciVal, 1996-2017. 


Как видим, ситуация в России обратна китайской: если у нас соло-статей гораздо больше, то у КНР гораздо меньше, чем у традиционных стран-лидеров. Причем, в сущности, еще недавно Китай находился на одном уровне с Японией (видимо, в силу общекультурных факторов: в восточных странах больше командной работы), но с начала 2000-х резко усилил дальнейшее движение к коллективизму. Россия продолжает оставаться страной одиночек в естественных науках, сильно опережая по доле соло-публикаций все исследованные нами страны. По всей видимости, это в первую очередь связано с худшей обеспеченностью современным научным оборудованием.

По общественным наукам ситуация с отечественными публикациями в Scopus странная: на графике четко виден горб с пиком в 2009-2010 годах. Причины такой динамики нам пока известны не до конца, но можно предположить, что резкое снижение доли соло-статей по общественным наукам в России последних лет связано с таким же резким ростом числа отечественных публикаций в слабых и потенциально недобросовестных журналах. Так, если для НИУ ВШЭ в тематике «Экономика и бизнес» доля соло-статей составляет за последние годы около 27%, то для второго российского лидера по числу Scopus-публикаций в данной области – менее разборчивого по части уровня журналов Казанского федерального университета – доля соло-статей всего 9%. Отчасти это связано с тем, что фирмы-посредники, к которым обращаются стремящиеся получить публикацию в Scopus малыми трудами, продают места в списке соавторов, поэтому им гораздо выгоднее компоновать статьи с пятью-шестью и более соавторами, в том числе вовсе не знакомыми друг с другом. В Web of Science, славящейся более строгим отбором журналов, аналогичного горба у графика по России нет.

Впрочем, интереснее и важнее посмотреть не на статьи в сомнительных журналах, а на издания топового уровня. К таковым мы здесь отнесем журналы первого квартиля по базе Web of Science, благо в InCites в последнее время для их фильтрации появилась особая опция, серьезно облегчившая анализ. Мы рассмотрели все articles и reviews с российской аффилиацией в изданиях, находящихся в верхней четверти распределения журналов по значению импакт-фактора в год выхода публикации среди всех журналов в данной предметной области. Если у журнала несколько квартилей из-за попадания в разные тематики, брался максимальный; у подавляющего большинства гуманитарных журналов импакт-факторов и квартилей нет, поэтому они в выборку не попали. Информация о квартилях есть c 1997 года, так что был взят массив 1997-2016 годов.

Рисунок 4. Общее число соло-публикаций в Q1 с российской аффилиацией и процент от общего числа соло-articles и reviews с российской аффилиацией в журналах, имеющих квартили. Данные InCites.




Мы видим, что доля российских соло-статей в топовых журналах в последние годы растет «быстрее рынка». Некоторое снижение доли наметилось лишь в прошлом году. Заметим, смещение в Q1 в последние годы в общем характерно не только для соло-статей. При этом доля соло-статей в Q1 от общего числа статей России в Q1 с 1997 по 2016 год линейно падала с 10,2% до 5,3%, практически в два раза. Если поспекулировать, можно заметить, что одна из причин – стало лучше с оборудованием, а вторая – стало иначе с управлением (в оценке результативности стала тотально преобладать примитивная наукометрия, а одной и той же статьей могут отчитаться и Вася, и Петя, и герр ректор, главное – быть в списке соавторов). Третья, еще более спекулятивная причина уже звучала: наука становится все сложнее.

Если посмотреть на тематики российских соло-статей в топовых журналах, то там в 1990-е на первом месте была ровно та самая область, где у нас больше всего коллайдерных статей с тысячами соавторов. Даже журналы у соло-статей и у «братских могил» одни и те же – Physical Review D и Journal of High Energy Physics, соответственно главные американский и европейский журналы по физике высоких энергий и частиц. Потом, однако, математика отыграла свое. В определенной мере этому поспособствовал подъем в Q1 нашего самого престижного математического журнала – УМН (еще в 2009-м он был в Q4). К слову, добились они этого, ужесточив рецензирование. Есть такой экзотический способ, о котором мало кто знает...

Далее перейдем к более сложным с точки зрения наукометрической техники вещам – анализу аффилиаций. Тут уже одним InCites нам не обойтись, надо вручную экспортировать публикации из него в WoS, а оттуда выгружать для анализа во внешних программах. Но это того стоит.

Во-первых, в 19% соло-статей у авторов есть аффилиации не только российских, но и иностранных организаций (США и Германия – по 4-4,5%, остальные сильно меньше). Во-вторых, что достаточно важно, этот процент с 1997 года в общем не меняется. В-третьих, «интернациональные» соло-статьи цитируются гораздо лучше чисто российских (напомним, мы говорим только про статьи в Q1). Естественно, речь про нормализованную цитируемость, ибо абсолютные цифры использовать никак нельзя: разные тематики и годы. В распоряжении у нас сразу два варианта нормализации: Category Normalized Citation Impact (CNCI) нормализует на среднюю цитируемость статей того же типа, года и предметной области, а если областей у статьи много, берется среднее. Journal Normalized Citation Impact (JNCI) нормализует на среднюю цитируемость публикаций в том же самом журнале за данный год. Так вот, для чисто российских соло-статей в топовых журналах значение CNCI составляет 0,63, а для «интернациональных», в которых у автора есть и российская, и одна или несколько иностранных аффилиаций, – уже 0,85. Соответствующие показатели JNCI составляют 0,71 и 1,15.

Отрадно, что и у «интернациональных», и у чисто российских соло-статей нормализованная цитируемость (в обоих вариантах) с 2008-2009 года пошла в рост.


Помимо аффилиаций, по которым ведется учет публикаций организаций в рейтингах и всяческих министерских мониторингах, в статьях есть и другая, не менее интересная информация о месте работы автора – его репринтный адрес (исторически – почтовый адрес, куда можно было написать автору и попросить выслать репринт (копию) статьи). Соответственно, такой адрес c большой долей вероятности указывает реальное местонахождение автора. Например, самая цитируемая (по CNCI) из всех семи с половиной тысяч российских соло-статей в Q1 – знаменитая статья Алексея Китаева про квантовые вычисления, в ней у него аффилиации ИТФ Ландау и Калтеха, а вот адрес указан Калтеха, где он, насколько известно, давно и пребывает. То же самое со статьей Дмитрия Свергуна – работает в Гамбурге, а ставит аффилиацию еще и Института кристаллографии. Скорее всего, речь о своеобразном формате поддержки.

Любопытно, что соло-статьи с американским репринтным адресом цитируются существенно больше, чем с немецким, а те, в свою очередь, опережают российские. Но, так как количество американских и немецких статей не так велико, делать вывод о торжестве американской науки на таких данных сложно.

Очень важная тенденция последнего времени – рост числа аффилиаций на человека, сиречь числа мест работы на сильного автора. На соло-статьях это прекрасно видно (рис. 5).

Рисунок 5. Трехлетнее скользящее среднее число аффилиаций на соло-публикацию с российской аффилиацией в Q1, InCites.




Любопытную динамику на этом графике уместно трактовать так.

В 1990-е продолжался массовый отъезд сильных авторов, отсюда рост. Да и оставшиеся стали устраиваться в несколько мест, ведь платили за науку в те годы очень мало. Потом уехавшие стали прекращать писать аффилиации России. В 2007-2010 годы были серьезные сокращения в РАН, ставки сокращали, уехавших увольняли. Ну а потом начался Проект 5-100, с его наплывом иностранцев и перетоком людей из РАН в вузы. Сейчас четыре аффилиации у сильного и бойкого ученого – почти норма, пять уже не удивляют. Так, Владимир Уверский, один из самых известных и цитируемых биологов российского происхождения, ранее выступавший лишь донором родного Пущино, ставит теперь в affiliations два вуза и два НИИ РАН, в числе прочих – King Abdulaziz University, саудовский университет, известный программой скупки аффилиаций высокоцитируемых ученых, нацеленной на покорение Шанхайского рейтинга.

Наиболее зримо это проявляется в Проекте 5-100, для вузов которого приглашение сильных ученых со стороны – один из основных способов быстро нарастить число публикаций в топовых высокоцитируемых журналах. На соло-статьях это прекрасно видно (рис. 6). Основными донорами выступают НИИ РАН (мы видим многократный рост числа соло-статей с аффилиацией РАН и вуза 5-100 в топовых журналах) и иностранные университеты.

Надеемся, приведенные данные показали, насколько интересны и информативны могут быть данные по публикациям в зависимости от числа соавторов. В следующих выпусках «Измерений науки» мы расскажем о других интересных типах статей, в частности о мегаколлаборациях.


Рисунок 6. Трехлетнее скользящее среднее число аффилиаций на соло-публикацию с российской аффилиацией в Q1, Россия в целом и вузы первой волны Проекта 5-100, InCites. 










Авторы текста: Стерлигов Иван Андреевич, Ходжер Татьяна Андреевна, 23 ноября, 2017 г.