Участник:Evgen/Заявка РФФИ

Материал из ЭНЭ
Перейти к: навигация, поиск
Форма 4. Содержание инициативного проекта


4.1. Фундаментальная научная проблема, на решение которой направлен проект


Создание общедоступной онлайновой научной энциклопедии на основе вики-технологий

4.2. Конкретная фундаментальная задача в рамках проблемы, на решение которой направлен проект (если данная задача является дополнением к теме работ, выполняемых авторами по плану своей организации, - указать название и гос. регистрационный номер этой темы)


Современные тенденции информационного обеспечения научных исследований и опытно-конструкторских разработок требуют наличия онлайновых ресурсов, позволяющих быстро анализировать и обрабатывать значительное количество информации из различных отраслей науки и техники. Например, многие научные работы в лазерно-информационных технологиях затрагивают одновременно физиков и медиков, химиков и программистов, биологов и конструкторов. Специалисты разных научных отраслей используют свои специфические термины, которые не всегда оказываются понятны коллегам. Возможности традиционных, бумажных энциклопедий – ограничены. Их неудобно использовать, возможности поиска по ним – ограничены, возможности дополнения, обновления, исправления ошибок – крайне ограничены. В то же время развитие информационных технологий и интернета сделали возможным создание онлайновых энциклопедий. Причем наибольшую известность и популярность приобрели энциклопедии, основанные на вики-технологиях и со свободным доступом.


Вики-технологии с формальной точки зрения включают в себя сервер (управляющая программа) базы данных, веб-сервер, программное обеспечение так называемого вики-движка, а так же различные расширения и утилиты для вики-движка, веб-серверов и баз данных. C практической точки зрения вики-технологии – это технологии, позволяющие пользователям непосредственно создавать и редактировать веб-страницы , без помощи постороннего веб-мастера или администратора. Создаваемые веб-страницы могут быть статьями энциклопедии, персональными страницами, веб-страницами научных лабораторий, проектов, веб-вариантами препринтов и т.п. - все зависит от целей и задач, которые ставятся перед конкретным сайтом. Однако возможности вики-технологий не ограничиваются простотой и легкостью создания страниц или, в терминах энциклопедии – статей. Вики-технологии включают в себя также: контроль версий, возможности категоризации, возможности обсуждения статей, управление правами участников и возможностей просмотра или редактирования статей и т.п.


Наиболее популярным самым мощным вики-движком является MediaWiki, который был написан специально для «Википедии» и используется как во всех проектах фонда «Викимедиа» (организации-основателя Википедии), так и во многих других проектах . MediaWiki интенсивно развивается, регулярно (раз в квартал) выходят новые версии; кроме того, активно используется и развивается механизм расширений.


В качестве примера информационного ресурса, работающего на вики-технологии, можно привести MachineLearning.Ru (проект РФФИ № 07-07-00372)


Вики-технологии являются одним из современных направлений в информационных технологиях, но все еще недостаточно широко используются в науке и образовании, а их потенциал - недостаточно оценен.


Задачами данного проекта являются:


  • Получение опыта создания и функционирования специализированной вики-энциклопедии в условиях свободного доступа в Интернет.
  • Учёт социального опыта других вики-ресурсов (в первую очередь – Википедии) для обеспечения оптимального с точки зрения научного сообщества функционирования экспериментальной научной энциклопедии
  • Разработка принципов взаимодействия специализированной вики-энциклопедии с русскоязычным разделом «Википедии»
  • Привлечение научных сотрудников к работе в вики-среде
  • Создание кластера научно-технических статей по отдельному мульти-дисциплинарному направлению «лазерно-информационные технологии» в качестве приоритетного направления наполнения энциклопедии.
  • Перевод в вики-формат статей старых энциклопедий (Брокгауз и Ефрон, Малая советская энциклопедия и т.д.).
  • Предоставление площадки для публикования препринтов в вики-формате, а также виртуальных научных семинаров и обсуждений.
  • Обмен опытом с другими автономными научными и образовательными вики-ресурсами, в том числе созданными при поддержке РФФИ..


4.3. Предлагаемые методы и подходы (с оценкой степени новизны; общий план работ на весь срок выполнения проекта)


  • Внедрение вики-технологий в ИПЛИТ РАН как часть внутренних веб-сервисов
  • Перевод вики-сервера от одно-машинной к кластерной организации с целью повышения производительности и надежности
  • Написание научно-технических статей по мульти-дисциплинарному направлению «лазерно-информационные технологии»
  • Разработка программного обеспечения, облегчающего перевод текстов в вики-формат из других форматов
  • Разработка программ обслуживания (так называемых "ботов" и других сервисных программ) для вики-энциклопедии
  • Перевод с «ручным контролем» в вики-формат части имеющихся в свободном доступе текстов энциклопедии «Брокгауза и Ефрона» как культурно-исторического памятника-документа истории науки и техники.
  • Оцифровка и перевод в вики-формат Малой советской энциклопедии 1931 г. как культурно-исторического памятника-документа истории науки и техники.
  • Информирование и обучение научных сотрудников работе в вики-среде, в первую очередь в ИПЛИТ РАН как площадки для получения необходимого опыта. Информирование о ходе проекта в Интернет-средствах массовой информации и в «Википедии»


4.4. Ожидаемые в конце 2009 года научные результаты (развернутое описание с оценкой степени оригинальности; форма изложения должна дать возможность

провести экспертизу результатов).


  • Наработка технического опыта создания и функционирования специализированной вики-энциклопедии в условиях свободного доступа в Интернет.
  • Разработка правил работы в вики-энциклопедии, обеспечивающих оптимальное с точки зрения научного сообщества функционирование экспериментальной научной энциклопедии..
  • Разработка принципов взаимодействия специализированной вики-энциклопедии с русскоязычным разделом «Википедии»
  • Привлечение научных сотрудников к работе в вики-среде
  • Создание кластера научно-технических статей по отдельному мульти-дисциплинарному направлению «лазерно-информационные технологии» в качестве приоритетного направления наполнения энциклопедии.
  • Перевод в вики-формат статей старых энциклопедий (Брокгауз и Ефрон, Малая советская энциклопедия и т.д.).
  • Создание площадки для опубликования препринтов в вики-формате, а также виртуальных научных семинаров и обсуждений.
  • Обмен опытом с другими автономными научными и образовательными вики-ресурсами.


4.5. Современное состояние исследований в данной области науки, сравнение ожидаемых результатов с мировым уровнем


В настоящее время существует несколько вики-движков, из которых наибольшей популярностью, в особенности для больших проектов, пользуетсяMediaWiki , на котором работает в том числе и наиболее известный проект в области создания свободной универсальной энциклопедии является «Википедия». В настоящее время Википедия имеет разделы на более чем 200 языках народов мира, количество статей в англоязычном разделе превысило 2.5 млн.статей, русскоязычного раздела – 315 тыс. статей. Количество статей ежедневно увеличивается. Поисковые системы интернета ( Google www.google.ru, Яндекс www.yandex.ru, Рамблер www.rambler.ru, «Нигма» www.nigma.ru ) по большинству запросов на первых позициях выдают статьи Википедии.


Однако «Википедия» с одной стороны не является научной энциклопедией и не ставит своей задачей следование точности и объективности при написании статей. Кроме того, можно указать следующие недостатки «Википедии»:

  • Фактический запрет на авторские статьи (запрет подписей в статьях)
  • Фактический запрет на публикацию о текущих научных исследованиях. (в терминах Википедии это звучит как «Википедия – не первичный и не вторичный источник информации», «Википедия не занимается “оригинальными исследованиями”» )
  • Только один вариант лицензии для содержимого статей (GFDL), который к тому же имеет определенные юридические проблемы в Российской Федерации (до сих пор нет официального перевода текста лицензии на русский язык).
  • Негативное и недоброжелательное в достаточно большом количестве случаев отношение сообщества «Википедии» к учёным и преподавателям (например, см Corruption of Wikipedia)
  • Наличие большого числа дилетантов среди авторов «Википедии» (хотя в некоторых случаях дилетантам удается написать о каком-то явлении лучше, чем профессионалам в своей области)
  • Большое количество сложных, часто противоречивых и изменяющихся правил и, в некоторых случаях, неоправданный произвол администраторов при их применении.
  • Закрытость структуры серверов, обслуживающих «Википедию», отсутствие нерекламных публикаций о методах и средствах обеспечения функционирования проекта под высокой нагрузкой.
  • Расположение на серверах в США, нахождение серверов Википедии и самого фонда "Викимедия" под юрисдикцией США, что потенциально может быть использовано для ограничения доступа к информации по политическим мотивам.
  • Потенциальная возможность коммерциализации проекта и связанные с этим возможные проблемы с авторскими правами и авторами (не все авторы согласны с возможным коммерческим использованием их статей, и не все участники Википедии считают, что возможная коммерциализация проекта может вызвать какие-то проблемы).


Кроме «Википедии» можно отметить еще ряд wiki-сайтов :

  • http://wiki.web.ru/ - GeoWiki, ГеоВики - часть проекта «Все о геологии», осуществляемого при поддержке Геологического факультета МГУ, и РФФИ . В настоящее время содержит 4300 статей из области геологии.
  • «Викизнание» - исторически проект появился раньше русскоязычного раздела Википедии, однако основатель проекта ограничился в основном автоматической заливкой текстов из «Брокгауза и Ефрона» и фактически остановил дальнейшее развитие проекта.
  • Летописи.ру” - учебная википедия для школьников и учителей
  • Wikia - «конструктор» вики-проектов (http://www.wikia.com). С одной стороны – этот проект достаточно удобен для начинающих, т.к. не нужно заниматься установкой и поддержкой вики-серверов, однако систематическое использование вызывает ряд трудностей (назойливая реклама, относительные сложности при контактах с администраторами сервера и т.п.)


Неинтерактивные онлайновые энциклопедии. Некоторые из этих энциклопедий до сих пор предоставляют платный доступ к своему содержимому, другие же, используют оцифрованные варианты «классических энциклопедий» из которых, как представляется набольшее развитие получили Яндекс-словари (http://slovari.yandex.ru/ всего 78 словарей). Однако, как правило, подобные словари не содержат иллюстраций и страдают либо излишней краткостью, когда используются словарные определения, либо убогостью оформления и форматирования. (В качестве примера можно указать статьи “Общая теория относительности” на сайте «Яндекса», “относительности теория” из БСЭ на сайте «Рубрикона» и статью “общая теория относительности” в «Википедии» ).


Онлайновая свободная публикация научных статей использована, например, в журнале «Исследовано в России» и семействе журналов Open access journals. Возможное использование вики-технологий может дополнять подобные способы публикаций, т.к. у вики-публикаций есть несколько преимуществ: в первую очередь – это оперативность и возможность изменения (есть возможность исправить ошибки, добавить новый материал, поставить ссылки), а также возможность комментирования. Кроме того, публикации в вики-формате гораздо лучше индексируются Интернет-поисковиками, чем публикации в формате pdf , который используется для онлайновой публикации научных статей.


Подводя итог, можно сказать, что представляется актуальной задача создания ресурса, дополняющего Википедию, который бы с одной стороны отражал научную точку зрения в области естественных наук, а с другой стороны - не повторял бы ошибок, допущенных Википедией, и был бы дружественным по отношению к учёным и специалистам. Этот ресурс должен предоставлять большие возможности по сравнению с Википедией публикации своих научных результатов. Кроме того, эти возможности могут быть использованы как дополнительный к традиционным средствам публикации канал .


Для своей работы предлагаемый ресурс должен использовать движок WikiMedia, что должно обеспечить совместимость по форматам и используемым расширениям в Википедией и другими упомянутыми вики-ресурсами.


Кроме того, WikiMedia, как и все остальное программное обеспечение, требующееся для работы вики-сервера, является свободным программным обеспечением и не требует дополнительных финансовых затрат.



4.6. Имеющийся у коллектива научный задел по предлагаемому проекту: полученные ранее результаты (с оценкой степени оригинальности), разработанные методы (с оценкой степени новизны)


  • Создан и работает вики-проект «ЭНЭ» (“Экспериментальная научная энциклопедия”) по адресу http://wiki.laser.ru
  • В рамках ЭНЭ создано, а также обработано и переведено в вики-формат из различных источников к настоящему времени (сентябрь 2008) более 4000 статей.
  • Получен определенный опыт функционирования вики-сервера в реальных условиях Интернета, в том числе в области защиты от Интернет-вандалов, получен определенный опыт администрирования сервера, установки расширений, собирается статистика обращений к серверу.


4.7.1. Список основных публикаций коллектива, наиболее близко относящихся к предлагаемому проекту (каждая с новой строки)



4.7.2. Список основных (не более 5) публикаций руководителя проекта в рецензируемых журналах за последние 3 года (независимо от их тематики; каждая с новой строки)


4.8. Перечень оборудования и материалов, имеющихся у коллектива для выполнения проекта


  • офисный компьютер (Pentium-4, 2 ГГц, 1 Гб RAM, 200 ГБ HDD)
  • подключение к Интернет по высокоскоростному каналу связи


4.9. Перечень оборудования и материалов, которые необходимо дополнительно приобрести, изготовить или отремонтировать для успешного выполнения проекта. Обосновать необходимость и указать стоимость в ценах по состоянию на 1 мая 2008 г. (в руб.)


1. “Экономичный и производительный сервер на базе двухъядерных или четырехъядерных  процессоров (Intel Xeon или аналогичных)” – 85 000 рублей


сервер необходим для повышения производительности и надежности функционирования wiki-сервера с учетом перспективы увеличения нагрузки и роста числа запросов. Надежность должна быть обеспечена за счет использования высоконадежного серверного компьютера и raid-массива жестких дисков, производительность – за счет использования высокопроизводительных процессоров Intel Xeon или аналогичных.


Подпись руководителя проекта