Участник:Evgen/Заявка РФФИ

Материал из ЭНЭ
Перейти к: навигация, поиск

Содержание

Форма 4. Содержание инициативного проекта

4.1.Фундаментальная научная проблема, на решение которой направлен проект

Создание общедоступной онлайновой научной энциклопедии на основе вики-технологий


4.2. Конкретная фундаментальная задача в рамках проблемы, на решение которой направлен проект

(если данная задача является дополнением к теме работ, выполняемых авторами по плану своей организации, - указать название и гос. регистрационный номер этой темы)


Современные тенденции информационного обеспечения научных исследований и опытно-конструкторских разработок требуют наличия онлайновых ресурсов, позволяющих быстро анализировать и обрабатывать значительное количество информации из различных отраслей науки и техники. Например, многие научные работы в лазерно-информационных технологиях затрагивают одновременно физиков и медиков, химиков и программистов, биологов и конструкторов. Специалисты разных научных отраслей используют свои специфические термины, которые не всегда оказываются понятны коллегам. Возможности традиционных, бумажных энциклопедий – ограничены. Их неудобно использовать, возможности поиска по ним ограничены, возможности дополнения, обновления, исправления ошибок – крайне ограничены. В то же время развитие информационных технологий и интернета сделали возможным создание онлайновых энциклопедий. Причем наибольшую известность и популярность приобрели энциклопедии, основанные на вики-технологиях и со свободным доступом.


Вики-технологии с формальной точки зрения включают в себя: сервер (управляющая программа) базы данных, веб-сервер, программное обеспечение так называемого вики-движка, а так же различные расширения и утилиты для вики-движка, веб-серверов и баз данных. C практической точки зрения вики-технологии – это технологии, позволяющие пользователям непосредственно создавать и редактировать веб-страницы без помощи постороннего веб-мастера или администратора. Создаваемые веб-страницы могут быть статьями энциклопедии, персональными страницами, веб-страницами научных лабораторий и проектов, веб-вариантами препринтов и т.д. - все зависит от целей и задач, которые ставятся перед конкретным сайтом. Однако возможности вики-технологий не ограничиваются простотой и легкостью создания страниц или - в терминах энциклопедии – статей. Вики-технологии включают в себя также: контроль версий, возможности категоризации, возможности обсуждения статей, управление правами участников и возможностями просмотра или редактирования статей и т.п.

Наиболее популярным и самым мощным вики-движком является MediaWiki. Он был написан специально для «Википедии» и используется как во всех проектах фонда «Викимедиа» (организации-основателя Википедии), так и во многих других проектах . MediaWiki интенсивно развивается, регулярно (раз в квартал) выходят новые версии; кроме того, активно используется и развивается механизм расширений.

В качестве примера информационного ресурса, работающего на вики-технологии, можно привести MachineLearning.Ru (проект РФФИ № 07-07-00372)

Вики-технологии являются одним из современных направлений в информационных технологиях, но все еще недостаточно широко используются в науке и образовании, а их потенциал недостаточно оценен.

Задачами данного проекта являются:

  • Получение опыта создания и функционирования специализированной вики-энциклопедии в условиях свободного доступа в Интернет.
  • Учёт социального опыта других вики-ресурсов (в первую очередь – Википедии) для обеспечения оптимального, с точки зрения научного сообщества, функционирования экспериментальной научной энциклопедии
  • Разработка принципов взаимодействия специализированной вики-энциклопедии с русскоязычным разделом «Википедии»
  • Привлечение научных сотрудников к работе в вики-среде
  • Создание кластера научно-технических статей по отдельному мульти-дисциплинарному направлению «лазерно-информационные технологии» в качестве приоритетного направления наполнения энциклопедии.
  • Перевод в вики-формат статей старых энциклопедий (Брокгауз и Ефрон, Малая советская энциклопедия и т.д.).
  • Предоставление площадки для публикования препринтов в вики-формате, а также виртуальных научных семинаров и обсуждений.
  • Обмен опытом с другими автономными научными и образовательными вики-ресурсами, в том числе созданными при поддержке РФФИ..

4.3. Предлагаемые методы и подходы

(с оценкой степени новизны; общий план работ на весь срок выполнения проекта)


  • Внедрение вики-технологий в ИПЛИТ РАН как часть внутренних веб-сервисов
  • Перевод вики-сервера от одномашинной к кластерной организации с целью повышения производительности и надежности
  • Написание научно-технических статей по мульти-дисциплинарному направлению «лазерно-информационные технологии»
  • Разработка программного обеспечения, облегчающего перевод текстов в вики-формат из других форматов
  • Разработка программ обслуживания (так называемых "ботов" и других сервисных программ) для вики-энциклопедии
  • Перевод с «ручным контролем» в вики-формат части имеющихся в свободном доступе текстов энциклопедии «Брокгауза и Ефрона» как культурно-исторического памятника-документа истории науки и техники.
  • Оцифровка и перевод в вики-формат Малой советской энциклопедии 1931 г. как культурно-исторического памятника-документа истории науки и техники.
  • Информирование и обучение научных сотрудников работе в вики-среде, в первую очередь в ИПЛИТ РАН как площадки для получения необходимого опыта. Информирование о ходе проекта в Интернет-средствах массовой информации и в «Википедии»

4.4. Ожидаемые в конце 2009 года научные результаты

(развернутое описание с оценкой степени оригинальности; форма изложения должна дать возможность провести экспертизу результатов).

  • Разработка правил работы экспериментальной научной энциклопедии.
  • Разработка принципов взаимодействия специализированной вики-энциклопедии с русскоязычным разделом «Википедии»
  • Налаживание контактов с «Википедией», другими автономными научными и образовательными вики-ресурсами.
  • Привлечение научных сотрудников к работе в вики-среде
  • Создание кластера научно-технических статей по отдельному мульти-дисциплинарному направлению «лазерно-информационные технологии».
  • Перевод в вики-формат статей старых энциклопедий (Брокгауз и Ефрон, Малая советская энциклопедия и т.д.).
  • Создание площадки для опубликования препринтов в вики-формате, а также виртуальных научных семинаров и обсуждений.
  • Получение технического опыта функционирования специализированной вики-энциклопедии в условиях свободного доступа в Интернет и возрастающей нагрузки.
  • переход вики-сервера к кластерной организации из 2-3 серверов (компьютеров)

4.5.Современное состояние исследований в данной области науки, сравнение ожидаемых результатов с мировым уровнем

Википедия

В настоящее время существует несколько вики-движков, из которых наибольшей популярностью, в особенности для больших проектов, пользуется MediaWiki. На нем работает в том числе и наиболее известный проект в области создания свободных универсальных энциклопедий — «Википедия». В настоящее время Википедия имеет разделы на более чем 200 языках народов мира, количество статей в англоязычном разделе превысило 2.5 млн.статей, русскоязычного раздела – 315 тыс. статей. Количество статей ежедневно увеличивается. Поисковые системы интернета ( Google www.google.ru, Яндекс www.yandex.ru, Рамблер www.rambler.ru, «Нигма» www.nigma.ru ) по большинству запросов на первых позициях выдают статьи Википедии.

Однако «Википедия» не является научной энциклопедией и не ставит своей задачей следование точности и объективности при написании статей. Кроме того, можно указать следующие недостатки «Википедии»:

  • Фактический запрет на авторские статьи (запрет подписей в статьях)
  • Фактический запрет на публикацию о текущих научных исследованиях (в терминах Википедии это звучит как «Википедия – не первичный и не вторичный источник информации», «Википедия не занимается “оригинальными исследованиями”» )
  • Только один вариант лицензии для содержимого статей (GFDL), который к тому же имеет определенные юридические проблемы в Российской Федерации (до сих пор нет официального перевода текста лицензии на русский язык).
  • Негативное и недоброжелательное в достаточно большом количестве случаев отношение сообщества «Википедии» к учёным и преподавателям (например, см Corruption of Wikipedia)
  • Наличие большого числа дилетантов среди авторов «Википедии» (хотя в некоторых случаях дилетантам удается написать о каком-то явлении лучше, чем профессионалам в своей области)
  • Большое количество сложных, часто противоречивых и изменяющихся правил и, в некоторых случаях, неоправданный произвол администраторов при их применении.
  • Закрытость структуры серверов, обслуживающих «Википедию»; отсутствие нерекламных публикаций о методах и средствах обеспечения функционирования проекта под высокой нагрузкой.
  • Географическое расположение на серверах в США, нахождение серверов Википедии и самого фонда "Викимедия" под юрисдикцией США, что потенциально может быть использовано для ограничения доступа к информации по политическим мотивам.
  • Потенциальная возможность коммерциализации проекта и связанные с этим возможные проблемы с авторскими правами и авторами (не все авторы согласны с возможным коммерческим использованием их статей, и не все участники Википедии считают, что возможная коммерциализация проекта может вызвать какие-то проблемы).

Другие вики-проекты

Кроме «Википедии» можно отметить еще ряд wiki-сайтов :

  • http://wiki.web.ru/ - GeoWiki, ГеоВики - часть проекта «Все о геологии», осуществляемого при поддержке Геологического факультета МГУ, и РФФИ . В настоящее время содержит 4300 статей из области геологии.
  • «Викизнание» - исторически проект появился раньше русскоязычного раздела Википедии, однако основатель проекта ограничился в основном автоматической заливкой текстов из «Брокгауза и Ефрона» и фактически остановил дальнейшее развитие проекта.
  • Летописи.ру” - учебная википедия для школьников и учителей
  • Wikia - «конструктор» вики-проектов (http://www.wikia.com). Этот проект достаточно удобен для начинающих, т.к. не нужно заниматься установкой и поддержкой вики-серверов, однако систематическое использование вызывает ряд трудностей (назойливая реклама, относительные сложности при контактах с администраторами сервера и т.п.)

Неинтерактивные онлайновые энциклопедии

Неинтерактивные онлайновые энциклопедии. Некоторые из этих энциклопедий до сих пор предоставляют платный доступ к своему содержимому, другие используют оцифрованные варианты «классических энциклопедий», из которых, как представляется, набольшее развитие получили Яндекс-словари (http://slovari.yandex.ru/ всего 78 словарей). Однако, как правило, подобные словари не содержат иллюстраций и страдают либо излишней краткостью, когда используются словарные определения, либо убогостью оформления и форматирования. (В качестве примера можно указать статьи “Общая теория относительности” на сайте «Яндекса», “относительности теория” из БСЭ на сайте «Рубрикона» и статью “общая теория относительности” в «Википедии» ).

Онлайновая свободная публикация научных статей

Онлайновая свободная публикация научных статей использована, например, в журнале «Исследовано в России» и семействе журналов Open access journals. Возможное использование вики-технологий может дополнять подобные способы публикаций, т.к. у вики-публикаций есть несколько преимуществ: в первую очередь – это оперативность и возможность изменения (есть возможность исправить ошибки, добавить новый материал, поставить ссылки), а также возможность комментирования. Кроме того, публикации в вики-формате гораздо лучше индексируются Интернет-поисковиками, чем публикации в формате pdf , который используется для онлайновой публикации научных статей.

Тексты энциклопедий и поисковый спам в интернете

Русскоязычный интернет буквально наводнен текстами энциклопедий «Брокгауза и Ефрона» и БСЭ. Однако большинство сайтов используют эти тексты в качестве «приманки» для поисковых систем, то есть так называемого поискового спама. При этом сами тексты спаммеров не интересуют, они не занимаются их изучением, категоризацией, исправлением ошибок оцифровки, современным оформлением и иллюстрированием. В результате у пользователей интернета складывается впечателение о серости, безликости и безнадежном устаревании текстов этих энциклопедий. Однако на самом деле — это не так. В той же Википедии тысячи статей полностью основаны на текстах «Брокгауза и Ефрона» и многие тысячи — их используют. Сама Википедия также порой становится объектом использования «энциклонгов».

Тексты старых энциклопедий — «Брокгауза и Ефрона», Малой и Большой советских энциклопедий являются культурно-историческими памятниками-документами своих эпох, в том числе памятниками истории науки и техники. Они заслуживают более бережного отношения. Для правильной оценки перспектив и выбора приоритетов в какой-либо отрасли науки и техники очень полезно может оказаться ознакомление с уровнем знаний предыдущих поколений ученых и исследователей. Возможно, что через несколько десятков лет наши потомки будут точно также оценивать наш сегодняший уровень знаний.

Выводы

Представляется актуальной задача создания ресурса, дополняющего Википедию, который бы с одной стороны отражал научную точку зрения в области естественных наук, а с другой стороны - не повторял бы ошибок, допущенных Википедией и был бы дружественным по отношению к учёным и специалистам. Этот ресурс должен предоставлять большие возможности по сравнению с Википедией для публикации и пропаганды научных результатов. Кроме того, эти возможности могут быть использованы в качестве канала, дополняющего традиционные в научной среде средства публикации.

Для своей работы предлагаемый ресурс должен использовать движок WikiMedia, что должно обеспечить совместимость по форматам и используемым расширениям с Википедией и другими упомянутыми вики-ресурсами. WikiMedia, как и все остальное программное обеспечение, требующееся для работы вики-сервера, является свободным и не требует дополнительных финансовых затрат.

4.6.Имеющийся у коллектива научный задел по предлагаемому проекту: полученные ранее результаты (с оценкой степени оригинальности), разработанные методы (с оценкой степени новизны)

  • Создан и работает вики-проект «ЭНЭ» (“Экспериментальная научная энциклопедия”) по адресу http://wiki.laser.ru
  • В рамках ЭНЭ создано, а также обработано и переведено в вики-формат из различных источников к настоящему времени (сентябрь 2008) более 4000 статей.
  • Получен определенный опыт функционирования вики-сервера в реальных условиях Интернета, в том числе в области обеспечения безапасности, получен опыт администрирования сервера, установки расширений, собирается статистика обращений к серверу.

Публикации

4.7.1. Список основных публикаций коллектива, наиболее близко относящихся к предлагаемому проекту

(каждая с новой строки)


4.7.2.Список основных (не более 5) публикаций руководителя проекта в рецензируемых журналах за последние 3 года

(независимо от их тематики; каждая с новой строки)

4.8. Перечень оборудования и материалов, имеющихся у коллектива для выполнения проекта

  • офисный компьютер (Pentium-4, 2 ГГц, 1 Гб RAM, 200 ГБ HDD)
  • подключение к Интернет по высокоскоростному каналу связи
  • программное обеспечение вики-сервера: MediaWiki, PHP, веб-сервер apache, сервер баз данных MySQL

4.9. Перечень оборудования и материалов, которые необходимо дополнительно приобрести, изготовить или отремонтировать для успешного выполнения проекта.

Обосновать необходимость и указать стоимость в ценах по состоянию на 1 мая 2008 г. (в руб.)

1. Экономичный и производительный сервер на базе двухъядерных или четырехъядерных  процессоров (Intel Xeon или аналогичных) или же аналогичная по цене и функциональности конфигурация на основе нескольких высокопроизводительных офисных компьютеров – 85 000 рублей

сервер необходим для повышения производительности и надежности функционирования wiki-сервера с учетом перспективы увеличения нагрузки и роста числа запросов. Надежность должна быть обеспечена за счет использования высоконадежного серверного компьютера и raid-массива жестких дисков, производительность – за счет использования высокопроизводительных процессоров Intel Xeon или аналогичных. Однако анализ цен на рынке компьютеров и серверов позволяет предположить, что аналогичная или даже более производительная конфигурация сервера может быть получена из нескольких серийных офиссных компьютеров. Сравнительно менее высокая надежность отдельного компьютера может быть компенсирована за счет их количества. В случае поломки замена вышедшего из строя компьютера может производится относительно легко и быстро, в случае же поломки фирменного сервера и отсутствия "горячей замены", как показывает практика, могут возникнуть большие проблемы с ремонтом.

Кроме того, офисные компьютеры могут приобретаться по мере выполнения проекта, таким образом, производительность системы может повышаться по мере необходимости.