January 2013 Download this article as a PDFAbstract

За последние годы для улучшения нашего понимания условий устойчивости для крупномасштабных совместных проектов, особенно с экономической и перспективы управления были проведены обширные исследования. Однако влияние найма и удержания участников этих проектов получил сравнительно меньше внимания исследователей. Тем не менее эти проблемы имеют важное значение для практиков, особенно в отношении явно снижения способности основных открытых онлайн проектов для привлечения и удержания новых участников. Возможное объяснение для этого снижения состоит в том, что эти проекты просто достигли зрелого состояния развития. Марвелл и Оливер (1993) и Оливер, Марвелл и Тейшейра (1985) отмечают, что на начальном этапе в коллективных проектах участников мало и усилия являются дорогостоящими; в фазе диффузии растет число участников, как награждение их усилия; и в зрелой фазе некоторые неэффективность могут появиться как число вкладчиков больше, чем это требуется для работы.

В этой статье мы рассмотрим эту возможность. Мы используем оригинальные данные из 36 Википедий на разных языках для сравнения их эффективности в наборе участников. Мы выбрали Википедии, поскольку различные языковые проекты в различных государствах развития, но вполне сопоставимы по другим аспектам, обеспечивая тест влияния на эффективность. Результаты подтверждают, что, как представляется, большинство из крупнейших Википедий характеризуется сокращением возврата для масштабирования. В результате мы можем сделать интересные выводы, которые могут быть полезны для практиков, координаторов и руководителей совместных проектов с целью выявления ключевых факторов, потенциально влияющих на адекватное развитие их общин средне долгосрочной перспективе.

Введение

Мобилизация сотни участников, как и в случае Linux, тысячи авторов, как и в случае Википедии, открытых онлайн-сообществ рассматриваются в качестве центральной точки для инновационного поколения новых знаний (Chesbrough, 2003; Mahr и Ливенс, 2012). Открытым исходным кодом инициативы являются многочисленными, и они охватывают различные отрасли (балка и др., 2009). Успех таких проектов представляет новый взгляд на фундаментальных социально экономический вопрос в сегодняшнем обществе: устойчивость участия в коллективных действиях. Парадокс Олсон (Olson, 1965) свидетельствует о том, что большие группы имеют меньше возможностей, чем маленькие для содействия их общих интересов, поскольку индивидуальные стимулы для содействия уменьшению размера группы. Однако многие общины, всех размеров и в различных контекстах, продемонстрировали свою способность разрабатывать отдельные стимулы и институты, что делает их возможность развивать и защищать их «commons» (Остромирове, 1990; Hess и остром, 2006). Вопрос заключается, если эти общины смогут продолжать свою деятельность в долгосрочной перспективе.

Подбор и удержание новых членов является рецидивирующий вопросом для открытых общин, тема уже подчеркнул и изучены фон Крог, Спаета и Лакхани (2003) в случае открытого исходного программного обеспечения сообщества приток. Предупреждающий знак для устойчивости открытых общин является явное увеличение трудности набора и удержания новых членов, которое было отмечено для проекта Википедии в частности (Ортега, 2009). Однако разнообразие проектов делает его трудно оценить ли эти опасения оправданы, и насколько широко они применяются. Чтобы лучше доказательства ситуации, нам нужно лучше понять, как организовано производство в таких проектах. Однако сравнение проектов с открытым исходным кодом является сложным, поскольку они используют различные методы (например, языки), различных технических систем для поддержки сотрудничества (например, системы управления версиями), различные управленческие структуры и так далее. В этой статье мы ориентируемся на методологические аспекты оценки эффективности предлагать и проверить методологию перед применением комплекса для сравнения проектов. Поэтому мы стремились найти параметр, который обеспечит большую степень сопоставимости между проектами.

Википедия является интересным местом для наших исследований по нескольким причинам. Во-первых Википедия является большим и успешным Интернет-сообщество, сопоставимых во многом для открытых проектов программного обеспечения. Однако как отмечалось выше, это также проект, который наблюдается явное снижение быстродействия при наборе новых редакторов, поднимая вопрос устойчивости. Во-вторых структура Википедии поддается сравнение эффективности. Википедия имеет отдельную версию энциклопедии на разных языках. Каждая версия имеет независимая коллекция статей, ведет свое собственное сообщество редакторов (хотя ничего, кроме языка не позволяет редактор содействия более чем на одном языке Википедии). Важно отметить, что эти общины редакторов достигли различных уровней зрелости. Некоторые общины являются достаточно зрелыми, в то время как другие все еще начало и еще другие падают где-то между ними. Однако, все они разделяют один инструмент для совместного редактирования (MediaWiki) и те же основные правила для этого сотрудничества редактирования: «пять столпов» Википедии. Кроме того, если мы измеряем глобальную структуру этих общин как сеть, в которой статьи являются узлы и ссылки на другие статьи подключить эти узлы, кажется, быть приблизительно похожи, хотя бы для крупнейших Википедий (Zlatić и Stefancić, 2011). В отличие от исследований по открытым исходным кодом программного обеспечения (например, Crowston и др., 2006; Кох, 2009) что сравнение проектов, использующих различные технологии программирования языки или совместные инструменты, это единообразие может помочь нам лучше понять, какие различия могут быть связаны с процессом эволюции.

Статья организована следующим образом: во-первых, мы определяем входы и выходы оцениваемые в нашем анализе эффективности и наш подход анализа эффективности ввода вывода нескольких методов (в частности, анализ данных обертывания). Затем мы представляем данные и наши текущие результаты. Мы обсудим эти результаты в последнем разделе и представить некоторые выводы, которые могут быть полезны для практиков, руководителей и посредников в своего рода открытых общин, для оценки их эволюции и предотвращения негативных факторов, которые могут повлиять на надлежащее развитие этих общин в надлежащее время.

Развитие теории

Этот анализ сосредоточен на сравнении 39 крупнейших Википедий (согласно официальной статье фото фонда Викимедиа, который отображается на домашней странице каждой версии). Единица анализа для нашего исследования это сообщество Википедии в определенном языке (например, французский, немецкий, японский). Однако мы решили не включать английской Википедии в этом анализе, потому что это видно останец относительно многих аспектов. На сегодняшний день является крупнейшим Википедии по количеству статей с четыре раза больше записей, чем следующий язык (немецкой Википедии), поэтому мы были обеспокоены тем, что он будет иметь слишком большое влияние на наши результаты. Он также обладает гораздо более широкого сообщества, привлекая редакторов из пяти континентов, как он стал языковой версии по умолчанию для многих авторов и читателей. Таким образом трудно определить население, из которого английский язык обращается редакторы, что является необходимым шагом в нашем анализе.

С учетом этого примера проектов, мы оцениваем эффективность различных общин Википедии на каждом языке, чтобы превратить их читатели (входы) в вкладчиков (выходы). Исследования показали, что сочетание опытных редакторов и свежие новички увеличивает вероятность для статьи для достижения высочайшего качества, или «Статья», уровень в Википедии (Ransbotham и Кейн; 2011; Брайант и др., 2005; Arazy и др., 2011). Таким образом, вывод процесса набора является число редакторов (из различных типов, описанных ниже) вклад в проект. Мы берем в качестве ввода числа потенциальных доноров, также описанные ниже.

Экономисты формализовать связь между входными и выходными как производственная функция, буквально математической функции, давая количество результатов процесса для определенного количества входов. Эффективность – выходы, разделенные входы; для оптимизации эффективности средств для получения максимально возможных результатов для определенного количества входов. В нашем случае форма этой производственной функции неизвестно, как коэффициенты, касающиеся его компонентов. Однако, мы не пытаемся предложить характеристику Википедии производственной функции, а скорее оценить, если общины на разных языках больше (или меньше) эффективны, чем другие. После Фарелл (1957) относительная эффективность различных производителей можно сравнить путем изучения «границы производственной функции». Эта функция описывает для различных комбинаций входов и выходов, которые производители являются эффективными. Другими словами эффективность означает членов выборки производителей, которые имеют высокие выходы для конкретного сочетания материалов. Обратите внимание, что это определение эффективности является относительным, а не абсолютным; не существует какой-то теоретический смысл позади термина «эффективность». Дополнительное внимание в анализе эффективности производства является вопрос о «возвращении в масштабе», то есть, будь то крупный проект может быть более эффективным из-за его размера (например, в более крупных и более известный проект, легче привлечь новых производителей) или, возможно, менее эффективно из-за накладных расходов по координации большего числа участников.

Существует несколько методов для оценки границы производственной функции. Детальное сравнение выходит за рамки настоящего документа, но заинтересованные читатели упоминаются (Kitchenham, 2002) для более полного обсуждения этих методов, касающихся производства программного обеспечения. Мы использовали данные обертывания анализ (ДЭА) модели первоначально предложенный Charnes, Купер и Родос (1978), после (2009) использование Коха в случае с открытыми исходными кодами. Кох отметил, что «эти модели были разработаны для измерения эффективности некоммерческих единиц, в которых не четкие рыночные цены на их входы и выходы, а также четкую оценку своих отношений» (стр. 403). Кроме того, «DEA может учитывать для экономик или эффекта масштаба и может иметь дело с мульти ввода, мульти вывода систем, в которых факторы имеют различные весы» (стр. 398). Эти характеристики сделали DEA соответствующую технику для нашего сравнения различных проектов Википедии.

Данные

Внешние данные (входы)

Чтобы оценить вклад в процесс набора, нам нужно данные о количестве потенциальных редакторов для каждого Википедии на другом языке. Мы рассматриваем эту группу как число людей с высшим образованием, которые говорят на этом языке и имеют доступ к Интернету. Обоснование для этого выбора можно найти в Glott, Шмидт и Гоша (2010), а также как и обследование на французской Википедии (Дежан и Жюльен, 2012), показать, что авторы Википедии являются значительно более образованные, чем читателей. Для оценки Интернет-населения, мы извлечь данные из Internet World Stats. Этот сайт собирает данные об использовании Интернета из нескольких источников, включая «данные опубликованы Nielsen Online, Международным союзом электросвязи, GfK, местных регулирующих органов и других надежных источников». Данные доступны на уровне языка на китайский, испанский, японский, португальский, немецкий, арабский, французский, России и корейский. Для остальных случаев (голландский, венгерский, Персидский, Румынский, болгарский, хорватский и греческий) мы рассчитали общее число пользователей путем умножения ставки Интернет в основных странах, говорящих на языке населения этих стран, а также населения меньшинств, говорящих на языке по ценам Интернет в других странах, где говорят на языке. Аналогичная процедура была проведена для числа людей с высшим образованием по языку. Первичные данные для этой меры происходит от ЮНЕСКО для большинства стран в исследовании и ОЭСР для России и Китая. Конечно эти источники обеспечивают лишь приближенные значения желаемых входных переменных, но они наши лучшие оценки. Однако резкое неточность в этих оценках будут в свою очередь влияет на нашу оценку производительности.

Сбор данных Википедии (выходы)

Как и в предыдущих исследованиях Википедии (например, Уилкинсон и Губерманом, 2007; Ортега и др., 2007; Ортега и др., 2009), мы опирались на дампов базы данных, опубликованной Фондом Викимедиа. Эти базы данных содержат полные записи (Дата и время, автор, т. д.) каждого единого взноса, который поставляется в виде «пересмотра» на любую страницу в любом из 39 Википедий стадии изучения. Таким образом, можно подсчитать количество активных редакторов в месяц и разбить их на три группы, следующие определения предлагаемых Фондом Викимедиа: очень активные википедисты (те с 100 или более изменений в данном месяце); Активные википедисты (между 5 и 100 в месяц) и другие участники (те, с меньшим количеством числа правок в определенный месяц). Для этого шага извлечение данных была реализована в виде программного обеспечения программа, которая является частью WikiDAT (набор средств анализа данных Википедии).

Анализ подхода: DEA моделирование

Мы должны рассмотреть два основных критерия относительно выбора модели DEA: ее ориентацию (ориентированных на вход или выход ориентированный) и возвращение масштаба в производственном процессе. Что касается первых критериев, как (Кох, 2009), выход ориентация представляется более уместным с учетом что, за определенный период времени, входы (население добровольцев, потенциально присоединения к Википедии на определенном языке) более или менее фиксированный и цель заключается в том, чтобы максимизировать выход. Что же касается второго критериев, учитывая исследование о коллективных действиях (Марвелл и Оливер, 1993) анализ программных проектов и наши предыдущие дискуссии, кажется, довольно трудно предположить постоянное возвращение к шкале. Вместо этого эти проекты, как представляется, имеют все возвращения для масштабирования в первом этапе, а затем снижение. Таким образом мы используем ОЦК-O (ориентированной) модель (банкир, Charnes и Купер, 1984) которая позволяет нам оценить возвращение масштаба. Для анализа данных мы адаптировали в садик (2011) макрос под SAS.

Выводы

Исследовательский сюжет наших наборов данных показывает сильный (но не совершенен) корреляция между общее число участников Википедии, Интернет населения (рис. 1) и общее высшее образование представителей населения (рис. 2). Использование модели DEA, мы можем определить различные уровни эффективности в преобразовании этих материалов для сообщества Википедии участников различных видов. Мы сначала применить постоянное возвращение к масштабной модели, то взамен мы представляем возможность изменения масштаба. На рисунке 3 показаны результаты этого анализа. Эти проекты перечислены в порядке убывания их размера. Полоски указывают на относительную эффективность. Длинный баров, составляет 100% эффективности, соответствуют проектам на эффективной границе, то есть те, которые создают большинство результатов от их конкретной комбинации материалов. Более короткие бары представляют проекты, которые используют аналогичный набор входов, но производят сравнительно меньше результатов, чем другие проекты. В частности некоторые Википедий, например Малайзии (МС), арабском (ar) и китайский (zh), имеют много редакторов меньше чем будет предложено населением пользователей Интернета, которые могли бы стать редакторами, в то время как Эстонский (et), Венгерский (hu), Norsk (no) и финский (fi) показывают высокую эффективность при наборе редакторов. Что касается возвращения масштабирования, таблица 1 представляет знак возвращения переменной масштаба. Кажется, что выставка крупнейших и наиболее эффективных проектов снижения прибыли для масштабирования, предлагая увеличение трудности при наборе новых википедистов. С другой стороны когда они являются эффективными, меньше Википедий кажется все еще в повышать доходность к этапу шкалы.

Рисунок 1

Рисунок 1. Число участников по сравнению с Интернет-населения

Рисунок 2

Рисунок 2. Число участников по сравнению с населения с высшим образованием

 

Рисунок 3. Эффективность при наборе участников. (Проекты перечислены в порядке убывания их размера).

 

Таблица 1. Возвращение в шкалу для вербовки участников. Эффективные проекты будут выделены жирным шрифтом и красным шрифтом.

Таблица 1

Заключение

Работа, представленная здесь первый шаг для выявления различий в практике работы различных проектов Википедии, проливают свет на устойчивость таких проектов коллективного интеллекта, и предлагается способ расширить работу, начатую Ствилиа, Аль-Фарадж и Yi (2009), Хара, Shachaf и Hew (2010) и Каллахан и сельдь (2011). Наш анализ показывает, что вопросы размера и зрелости уровня проекта, поскольку крупнейший Википедий оцениваются по этой модели, как неэффективно (которая вербует пропорционально меньше новых редакторов для данного сочетания потенциальных участников, чем другие проекты с сопоставимыми микс). Если мы добавим фактор для управления для возврата к шкале, крупнейших проектов, увеличить их производительность, но отображать отрицательный результат для масштабирования. Другими словами более крупные проекты являются явно в фазу, где они менее способны вербовать новых членов. Кроме того анализ показывает различия в эффективности среди небольших проектов, которые предположительно иначе при аналогичных состояниях развития.

Результаты нашего анализа наводящий, но явно представляют собой лишь первый шаг. Хотя мы показали различия в эффективности, мы не еще не понимают почему возникают эти различия. Следующий этап исследования будет найти лучшего объяснения этих различий. Там может быть множество возможных объяснений трудностей в наборе, но научную литературу проекты программного обеспечения с открытым кодом (Кох, 2008) и коллективных действий в целом (Марвелл и Оливер, 1993 год) свидетельствует о том, что такой спад просто может произойти в результате проекта, начать зрелый этап, в котором требуются меньшее количество дополнений и тем самым меньшее число вкладчиков,. Тем не менее возможность более тревожным является, что эволюция проектов привело к разработке рабочих моделей, которые делают вклад в эти проекты более трудным. Этот сценарий может сделать работу участников меньше вознаграждения (Ransbotham и Кейн; 2011), повышение невидимых барьеров для взносов от посторонних лиц и новых членов (остром перспективу) и что ставит под угрозу долгосрочную устойчивость проекта. Различать эти возможности для более крупных проектов имеет важное значение для понимания их перспектив.

Однако объяснить различия между более мелких проектов требует более тонкого объяснения. В то время как текущие данные не дают ответа, мы предполагаем два возможных объяснения. Во-первых многие из менее эффективных проектов имеют более низкий уровень третичного образованных людей, по сравнению с эффективной группой. Это различие может быть ключом к объяснению низкой эффективности набора персонала. Второе предположение рассматривает последствия контроля информации: многие из низкой эффективности проектов связаны в странах, где Интернет и производство информации является более тесно контролируется властями чем в эффективной группе. Может быть, что свобода выражения мнений является предпосылкой для эффективного найма редакторов. Чжан и Чжу (2011) недавнее исследование китайской Википедии дает аргументы в пользу этой гипотезы.

Лучше понять эти различия должны обеспечивать понимание долгосрочной устойчивости Википедии, а также другие проекты создания открытых знаний. В частности первая гипотеза предполагает, что эти проекты зависят от инвестиций в образование стран, в которых находятся проекты. Учитывая значение переменной высшего образования, университеты, как представляется, соответствующие места для продвижения Википедии, которая соответствует стратегии Фонда по Википедии образовательной программы.

Еще одной темой для будущих исследований является устранение ограничений в текущем исследовании. Основным ограничением является, что действительность нашего анализа зависит от качества используемых данных. В частности внешние данные, используемые для входных данных для процесса найма являются только лучшие оценки. Систематические ошибки в этих данных будут влиять на нашу меру относительной эффективности набора персонала для затронутых языков. С другой стороны в то время как мы вполне уверены в данных, извлеченных из Википедии свалки, ограничение работы, представленные здесь является, что мы оценили проекты только за один месяц, Август 2011. Только один месяц данных может привести к неправильного толкования, особенно принимая во внимание, что август месяц отпуска в некоторых странах. Мы работаем на расширение анализа до двенадцати месяцев и делать средняя оценка эффективности различных проектов.

Будущие исследования также могут изучить возможность передачи предлагаемой методологии с открытыми исходными кодами. Характеризуя открытым исходным кодом производственной функции, характеристики с точки зрения разработки программного обеспечения таких как время, чтобы закрыть ошибки, число выпуск докладов, представленных или деятельности в списках рассылки, могут иметь равное значение для общего числа участников для оценки устойчивости проекта. Также важно учитывать возраст проекта, как это отражено в возвращении в эффект масштаба. Осложнение, которое мы отметили во введении к статье то, что разнообразие open source проектов делает его трудно сравнивать их. Один из возможных подходов было бы для сравнения различных подпроектов в рамках более крупного проекта, который может контролировать для изменчивости в средствах и процессах.

Доля этой статьи:

Цитируете эту статью:

Оцените содержание: 
Нет голосов были поданы еще. Скажи свое слово!

Ключевые слова: DEA моделирование, эффективность, набор, Википедия

Добавить новый комментарий

Обычный текст

  • Теги HTML не разрешены.
  • Адреса электронной почты и адреса страниц включите в ссылки автоматически.
  • Строки и параграфы переносятся автоматически.