Годовой отчет Китая с открытым исходным кодом за 2020 г.

задняя часть внешний интерфейс Android iOS Открытый исходный код

Отказ от ответственности: этот отчет получен из открытого исходного кодаобщество с открытым исходным кодомРазрешено перепечатывать, эта статья ограничена размером выбранных выдержек, пожалуйста, загрузите полный отчетPDFизучать.

предисловие

Когда мы писали это предисловие, наши настроения были настолько сложными, что их трудно обобщить одним словом. Слова, которые поднялись в моем сердце, были: «Это лучшие времена, это худшие времена».

В течение многих лет мы будем оглядываться на 2020 год, он назовет его: кардинальные изменения в мире. Многие друзья в прошлом году, даже «Каждый день в истории, каждый день долго!» Эпидемия Newuan и торговая война между Китаем и США, обострились в том же году. Из-за эпидемии и торговой войны мир ускоряет изменения.

На этом историческом фоне мы также обнаружили следующие три тенденции в мире открытого исходного кода:

1. Развитие open source и тенденция от реального к виртуальному

Из различных данных, а также из наших собственных ощущений мы можем обнаружить, что существует большая тенденция развития глобального открытого исходного кода. Активные репозитории кода GitHub и количество активных пользователей быстро растут (35,3% / 21,2%); репозитории кода и пользователи Gitee растут еще более угрожающими темпами (192% / 162%).

С одной стороны, открытый исходный код уже много лет находится на подъеме. С другой стороны, это одна из наших догадок: после эпидемии все больше и больше людей стали работать удаленно, что фактически способствовало большему количеству людей иметь возможность «урезать», то есть удобно работать перед компьютер Переключайте несколько удостоверений и асинхронно обрабатывайте несколько транзакций, тем самым увеличивая время и возможности разработчиков для участия в открытом исходном коде.

Конечно, в том числе благодаря удаленной работе доля виртуальных миров в жизни человека стала больше. Будет ли это лучше, и какие проблемы это вызовет? Как человек, стоящий у входа в туннель, на самом деле невозможно догадаться.

2. Рост открытого исходного кода в Китае и тенденция к разделению мира открытого исходного кода.

С растущим влиянием все большего числа китайских проектов с открытым исходным кодом, запуском протокола Mulan, созданием Open Atomic Foundation, сверхвысоким ростом Gitee и новым выпуском CODE China мы уже можем быть уверены, что 2020 год будет с открытым исходным кодом в Китае.Год подъема. Друзья, которые прочитают отчет дальше, должны увидеть много определенных доказательств.

Однако из приведенных ниже данных можно увидеть еще одно примечательное явление. Между самыми активными китайскими проектами с открытым исходным кодом на GitHub и самыми активными проектами с открытым исходным кодом на Gitee нет абсолютно никакого совпадения.

Поскольку Gitee продолжает быстро развиваться, можно смело предсказать, что будет появляться все больше и больше высококачественных китайских проектов с открытым исходным кодом, которые выберут открытый исходный код на Gitee. Друг однажды упомянул «Один мир, две системы», которые постепенно станут реальностью.

Если открытый исходный код Китая «поднимется» таким образом, что он будет изолирован от мира, это не то будущее, которое мы хотим видеть.

3. Open source — это хорошо, а мы не готовы

С начала эпидемии многие люди, работающие с открытым исходным кодом, посвятили свое время, энергию, технологии и мудрость каждому противоэпидемическому проекту с открытым исходным кодом. и спасение родились Проект с открытым исходным кодом. Среди них типичным представителем является wuhan2020.

Поэтому во время подготовки Ежегодной конференции по открытому исходному коду Китая 2020 года мы без колебаний выбрали тему ежегодной конференции «Открытый исходный код во благо» и заслужили похвалу многих лекторов, участников и спонсоров.

Но как она должна развиваться дальше? Как «организовать, инкапсулировать и разложить по модулям» людей, собравшихся для борьбы с эпидемией, созданные ими проекты, накопленный ими опыт и извлеченные уроки, и как они должны быть готовы к будущим несчастным случаям? Это области для долгосрочного мышления и улучшения.

В качестве отчета, который стремится быть полным, объективным, всеобъемлющим и богатым, вопросов, которые стоит обсудить, конечно, больше, чем выше.Друзья могут прочитать отчет ниже и связаться с нами в любое время.

——Чжуан Бяовэй, председатель Общества открытого исходного кода

16 января 2021 г.

Приглашенные эксперты по обзору

  • У Шэн, член Apache Software Foundation, соучредитель местного сообщества Apache
  • Хуан Дунсюй, соучредитель и технический директор PingCAP
  • Ма Янцзюнь, старший научный сотрудник отдела обработки естественного языка Baidu
  • Цзян Тао, основатель и председатель CSDN, партнер-основатель Geekbang Venture Capital
  • Гао Ян, основатель и генеральный директор SegmentFault
  • сладкая картошка, основатель и технический директор Open Source China
  • Чжуан Бяовэй, председатель Общества открытого исходного кода
  • Чен Ян, вице-президент Общества открытого исходного кода
  • Ван Вэй, генеральный директор Open Source Society
  • Лю Тяньдун, директор Общества открытого исходного кода

1. Анкета

1. Предыстория отчета

В начале 2016 года Общество открытого исходного кода выпустило «Отчет об участии сообщества открытого исходного кода в Китае за 2015 год», и в последующие годы оно продолжало публиковать отчеты об опросах разработчиков, стремясь представить отечественную разработку открытого исходного кода с различных сторон. В этом году мы снова отправились рисовать карту открытого исходного кода Китая в 2020 году, комбинируя методы анализа данных и отчеты об опросах.

Эта анкета является важной частью ежегодного ежегодного отчета Китая с открытым исходным кодом, а аналитический отчет, не основанный на исследованиях, - это просто болтовня на бумаге. Опираясь на предыдущие годы, мы ссылаемся на другие существующие опросники основных разработчиков и добавляем некоторые новые точки зрения. На фоне COVID-19 в 2020 году, который нельзя игнорировать, этот вопросник еще больше расширяет перспективы таких тем, как онлайн-сотрудничество в мире открытого исходного кода и то, что открытый исходный код может принести миру.

Благодаря статистическому исследованию и анализу почти 60 проблем мы надеемся восстановить реальный статус-кво нынешнего китайского сообщества открытого исходного кода, чтобы обеспечить авторитетный справочник для последующих поколений открытого исходного кода.

  • Объекты опроса: охват разработчиков, членов сообщества, участников, студентов, правительственных и корпоративных менеджеров.
  • Содержание опроса: в основном охватывает личную информацию, статус работы, сообщество с открытым исходным кодом и технологии разработчиков.
  • Метод опроса: сбор образцов и данных с помощью онлайн-опросов и анализ данных методом перекрестного сравнения.
  • Метод продвижения: онлайн-социальные сети, блог, агентство с открытым исходным кодом, веб-сайт с открытым исходным кодом в Китае.
  • Количество вопросов: 59
  • Тип вопроса: с одним выбором, с множественным выбором, открытый
  • Размер выборки: 236

2. Важные выводы

Из-за эпидемии все анкеты этого года были распространены в Интернете, поэтому количество собранных образцов было меньше, чем в предыдущие годы, но все же можно было увидеть леопарда и наблюдать за тихими изменениями в открытом мире Китая. Анализируя статистику за 2020 год и сравнивая данные за предыдущие годы с другими опубликованными статистическими отчетами, мы пришли к следующим ключевым выводам:

  • Основная сила участников открытого исходного кода по-прежнему составляет 20-39 лет, и их доля по-прежнему растет по сравнению с прошлым годом.В возрастном распределении сообщества открытого исходного кода 20-30-летние составляют 64%, разработчиков по-прежнему имеет тенденцию быть моложе.
  • По сравнению с 2019 годом, среди разработчиков, участвовавших в опросе в этом году, подавляющее большинство составляли люди, которые еще не работали.Также из поля и распределения участников по должностям видно, что большинство таких «неработающих» людей относится к студенческой группе Это связано с общим стремлением к высшему образованию в современном обществе и формой распространения этой анкеты, но также показывает, что открытый исходный код добился хорошего прогресса в области образования;
  • Техническое направление, которым занимаются разработчики, по-прежнему в основном является фронтендом и бэкендом, из которых на бэкенд-разработку приходится около 31%, за ним следуют веб-интерфейс, ИИ и анализ больших данных, на которые приходится 10%9. % и 9% соответственно Доля техников и практиков в других отраслях составляет 7%, что указывает на то, что открытый исходный код привлекает все больше и больше внимания во всех сферах жизни;
  • В 2019 году форма участия в открытом исходном коде изменилась с кода и тестирования на код и документацию. Сообщество и проекты осознают важность документации, и все больше участников с открытым исходным кодом вкладывают средства в документацию;
  • Частота участия в мероприятиях с открытым исходным кодом увеличилась по сравнению с предыдущими годами, что также связано со все более процветающей атмосферой открытого исходного кода в Китае и постепенным обогащением деятельности с открытым исходным кодом. 81% разработчиков считают, что деятельность с открытым исходным кодом имеет решающее значение для развития и развития сообщества открытого исходного кода. Для совещаний, которые были более склонны к онлайн или офлайн, результаты были на удивление плоскими;
  • В контексте COVID-19 в 2020 году все сферы жизни неизбежно будут затронуты и затронуты; 82% людей считают, что эпидемия повлияла на участие в деятельности сообщества открытого исходного кода, но она также имеет движущий эффект. , а 11% считают, что нет воздействия, 7% считают, что негативное влияние эпидемии перевешивает положительное влияние;
  • Что касается использования онлайн-инструментов для совместной работы над документами, Graphite Documents прыгнула с третьего места на первое в форме темной лошадки, опередив вики и Google Doc.В Китае появляется ряд отличных инструментов для совместной работы, и их становится все больше и больше. популярный для всех одобрять;
  • 9 сентября 2020 года первый в Китае фонд программного обеспечения с открытым исходным кодом «OpenAtom Foundation» официально объявил о своем официальном объявлении.У всех есть несколько ожиданий: продвижение концепции открытого исходного кода, культурное образование с открытым исходным кодом и построение сообщества, создание экосистемы с открытым исходным кодом, обеспечение ранняя инкубация и поддержка проектов с открытым исходным кодом, помощь китайским сообществам открытого исходного кода в интеграции и оптимизации ресурсов, а также связь с международными сообществами открытого исходного кода.

3. Характеристики группы разработчиков

3.1 Участники, как правило, молоды и высокообразованны, 80% из них мужчины.

Возраст участников сосредоточен в пределах 20-39 лет, а уровень образования, как правило, находится на уровне бакалавриата или выше, из которых около 84% составляют мужчины и 16% женщины, что соответствует уровню прошлого года.

【Отзывы экспертов】

Лю Тяньдун: Доля женщин, участвующих в открытом исходном коде, аналогична данным опросов за последние 2-3 года, но выше, чем в среднем по миру (около 10-12%). Есть надежда, что в будущем больше женщин будут участвовать в открытом исходном коде в Китае и сформируют красивый ландшафт открытого исходного кода.

Чен Ян: Разнообразие всегда было лозунгом сообщества открытого исходного кода Глобальное сообщество открытого исходного кода выступило с призывом «поощрять участие женщин в открытом исходном коде» еще более десяти лет назад на ежегодной Китайской конференции по открытому исходному коду (COSCon). ), в Обществе открытого исходного кода есть Традиция проведения женских форумов. На COSCon 2020 мы пригласили женщин-лидеров сообщества открытого исходного кода, чтобы рассказать всему сообществу об их уникальных способностях и взглядах. Главный операционный директор GitHub Эрика Брешиа, которая управляет сообществом из более чем 50 миллионов программистов; Сторми Питерс, от исполнительного директора фонда GNOME до нынешнего руководителя офиса Microsoft с открытым исходным кодом; Хонг Фук Данг из Вьетнама, Азии, занимается открытым исходным кодом с основание FOSSASIA. В настоящее время является вице-президентом OSI в совете директоров. Широта и глубина участия женщин в открытом исходном коде движется в том направлении, в котором мы ожидаем сделать мир интересным и разнообразным.

3.2 Рабочее время и сфера деятельности

Среди участников наибольшее количество людей, которые еще не участвовали в работе, составляют около 36%, за ними следуют те, кто проработал 3-5 лет и 6-10 лет, что составляет 19% и 15%, соответственно и проработали лет 10. Около 20% вышеперечисленных.

Среди участников почти 70% участников заняты в области интернет-разработки/разработки программного обеспечения, за ними следуют участники в области образования/академических/научных исследований, на которые приходится около 15%, и в области финансового банкинга, средства массовой информации, реклама и развлечения также активно участвуют с открытым исходным кодом.

3.3 Распределение позиций

Большинство участников — студенты и разработчики, по сравнению с 2019 годом сильно увеличилась доля студентов, около 37%, а доля разработчиков — около 36%.

3.4 Техническое руководство занимается

Техническое направление участников - это в основном внутренняя разработка, на которую приходится около 31%, за ними следуют веб-интерфейс, ИИ и анализ больших данных, на которые приходится 10%, 9% и 9%, соответственно, нетехнический персонал. и другие отрасли Доля практиков составляет 7%, что указывает на то, что открытый исходный код привлекает все больше и больше внимания во всех сферах жизни.

【Отзывы экспертов】

Чен Ян: На заре открытого исходного кода открытый исходный код = Linux. Операционная система Linux, офисное программное обеспечение для настольных ПК (GNOME, OpenOffice) и браузеры (Mozilla) в то время были главным полем битвы проектов с открытым исходным кодом, которые положили начало первой волне открытого исходного кода; в последние годы, с появлением Интернета, проекты и технологии с открытым исходным кодом становятся все более популярными.Как расцветает сотня цветов, от баз данных к промежуточному ПО, от фронтенда к бэкэнду, от языков программирования к компиляторам, от IoT к микросервисам, от больших данных к искусственным интеллект, технологии и проекты с открытым исходным кодом становятся все более многочисленными и разнообразными.

4. Текущее состояние работы с открытым исходным кодом

4.1 Время связаться с открытым исходным кодом

Почти 30% участников имели доступ к открытому исходному коду в течение 1-2 лет, и почти 80% участников имели доступ к открытому исходному коду более одного года.

【Отзывы экспертов】

Чен Ян: Люди в сообществе открытого исходного кода очень стабильны и имеют своего рода сплоченность, как большая семья. Кружок открытого исходного кода более десяти лет назад был активен среди небольшой группы первых людей, занимающихся открытым исходным кодом. Я заметил, что большинству окружающих меня людей, занимающихся открытым исходным кодом, больше 10 лет, и они будут продолжать инвестировать в открытый исходный код в будущем. Данные за 2020 год показывают, что новых участников 30. С другой стороны, это также подтверждает, что движение за открытый исходный код показало состояние выхода из круга после многих лет развития.

4.2 Инвестиции времени в открытый исходный код

Около 44% участников инвестируют менее 5 часов в неделю в открытый исходный код, а около 40% участников инвестируют в открытый исходный код от 5 до 20 часов в неделю.

【Отзывы экспертов】

У Шэн: Относительно низкая доля профессиональных разработчиков с открытым исходным кодом (участников, работающих более 20 часов в неделю) показывает, что китайские предприятия по-прежнему в основном остаются на уровне пользователей для проектов с открытым исходным кодом. Большинство участников с открытым исходным кодом по-прежнему используют рабочее время или рабочие перерывы для ограниченного вклада и участия.

4.3 Действия с открытым исходным кодом

Подавляющее большинство участников участвуют в мероприятиях с открытым исходным кодом онлайн/офлайн всего несколько раз в год, и около 20% участников участвуют в мероприятиях с открытым исходным кодом онлайн/офлайн один или два раза в месяц. Оффлайн-мероприятия с открытым исходным кодом — это в основном салоны, лекции и т. д. Онлайн-мероприятия с открытым исходным кодом — это в основном онлайн-конференции, обсуждения в списках рассылки, PR-мероприятия и т. д.

81% участников считают, что мероприятия по открытому исходному коду имеют решающее значение для развития и развития сообщества открытого исходного кода.

【Отзывы экспертов】

Гао Ян: мы призываем разработчиков активно участвовать в мероприятиях с открытым исходным кодом, особенно в офлайн-мероприятиях. Офлайн-встречи и общение помогают укрепить доверие между людьми, что имеет большое значение для процветания сообщества и более эффективного сотрудничества между людьми.

Что касается мероприятий/конференций с открытым исходным кодом онлайн или офлайн, участники высказывают свое мнение.Оффлайн мероприятия позволяют общаться лицом к лицу, общение более эффективно, атмосфера лучше, и есть больше возможностей выйти на улицу, увидеться и завести новых друзей. , при этом онлайн-активности безопаснее и удобнее, не ограничены по времени, региону и т. д., и стоимость невысока, и содержание встречи можно записать, что удобно для просмотра после встречи.Конечно, офлайн-запись также становится все более распространенным явлением.

2020 – особенный год. Всемирная эпидемия COVID-19 в разной степени повлияла на все сферы жизни. 82 % участников считают, что эпидемия повлияла на участие в деятельности сообщества разработчиков ПО с открытым исходным кодом, но также имеет движущий эффект.

【Отзывы экспертов】

Лю Тяньдун: Воздействие новой коронной эпидемии ускорило участие большего числа удаленных рабочих групп в деятельности с открытым исходным кодом. Если взять в качестве примера «5th China Open Source Annual Conference + Apache China Roadshow», проведенную Kaiyuan Society 24-25 октября 2020 года, в онлайне приняли участие более миллиона человек, что в тысячу раз больше, чем количество участников в оффлайне. события в прошлом.В то же время, когда мы росли, в Интернете появилось больше международных и отечественных знаменитостей с открытым исходным кодом, чем в предыдущие годы. Хотя на этой конференции также проводились офлайн-встречи в пяти городах, можно ожидать, что в будущем онлайн-встречи станут нормой.

4.4 Доход с открытым исходным кодом

Видно, что многие люди участвуют в открытом исходном коде, не преследуя материального вознаграждения.30% участников не имеют дохода с открытым исходным кодом, но все еще увлечены работой с открытым исходным кодом.В то же время мы также можем заметить, что 12% участников участники сказали, что компания будет платить заработную плату, чтобы поддерживать сотрудников на полную ставку/участвовать в открытом исходном коде, 23% участников указали, что они поддерживают участие в открытом исходном коде с точки зрения школьных научно-исследовательских проектов или инвестиций в сообщества.Видно, что сейчас предприятия и школы постепенно обращают внимание и придают большое значение открытому исходному коду.

【Отзывы экспертов】

У Шэн: Доля дохода с открытым исходным кодом, который может быть получен, в значительной степени соответствует доле времени участия в открытом исходном коде, превышающем 20 часов, что хорошо показывает значительное изменение коммерческой ценности в интенсивности вклада открытого исходного кода. Хотя время вклада и доход не отражают качество взносов с открытым исходным кодом и проектов с открытым исходным кодом, высококачественные проекты требуют определенной коммерческой поддержки, чтобы получить положительный круг.

Чен Ян: 12% участников зарабатывают частично или полностью на открытом исходном коде.Проповедники открытого исходного кода, менеджеры по операциям с открытым исходным кодом и разработчики открытого исходного кода — все это популярные профессии в 2020 году, что свидетельствует о дальнейшем совершенствовании экосистемы открытого исходного кода. и предприятия начинают развивать резерв талантов с открытым исходным кодом, бизнес-логика открытого исходного кода становится ясной.

4.5 Удаленная работа

Удаленная работа на данный момент является очень важным способом работы: среди участников 80% считают, что удаленная работа важна, и почти 90% участников имеют опыт удаленной работы.

【Отзывы экспертов】

Гао Ян: Удаленная работа станет нормальным способом работы и сотрудничества в нашей работе и жизни.Движение за открытый исходный код и распределенное и удаленное сотрудничество естественным образом интегрированы.

4.6 Впервые продукты с открытым исходным кодом

Продукты с открытым исходным кодом, с которыми 32% участников впервые столкнулись, были интернет-продуктами, за которыми следовали продукты, связанные с операционными системами, и инструменты разработки. связанные продукты по-прежнему являются начальным окном для всех, чтобы понять и связаться с открытым исходным кодом.

4.7 Продукты, исходный код которых вы больше всего хотели бы иметь в открытом доступе

По сравнению с 2019 годом, инструменты разработки стали первым типом продуктов, исходный код которых все надеются открыть в этом году, за ними следуют операционные системы, продукты баз данных и промежуточного программного обеспечения, которые также являются типами продуктов, исходный код которых многие люди надеются открыть.

4.8 Вклад предприятия в открытый исходный код

По мнению участников, GitHub внес наибольший вклад в программное обеспечение с открытым исходным кодом, за ним следует Google, а среди отечественных предприятий тройку лидеров заняли соответственно Alibaba, Huawei и Baidu.

4.9 Роботизированная автоматизация процессов

Что касается того, унаследовали ли проекты с открытым исходным кодом RPA или роботизированные инструменты автоматизации процессов, 40% участников сказали, что некоторые проекты интегрировали RPA, 16% сказали, что почти все проекты интегрировали RPA, а 24% сказали, что они никогда не интегрировали RPA. RPA в проектах с открытым исходным кодом.

5. Текущий статус участия сообщества открытого исходного кода

5.1 Что вас больше всего привлекает в открытом исходном коде

Открытый и прозрачный код и обмен знаниями, а также духовная концепция открытого исходного кода стали наиболее привлекательными факторами для участников открытого исходного кода, при этом стоимость приобретения программного обеспечения не является главным фактором.

5.2 Какой ваш любимый продукт с открытым исходным кодом

Linux стал любимым продуктом с открытым исходным кодом участников с огромным преимуществом, за ним следуют MySQL, Apache и темная лошадка контейнерной индустрии Docker, занявшие третье и четвертое места соответственно.

5.3 Участие в конкретной общественной работе

Подавляющее большинство участников участвуют в написании кода или документации в сообществе.Тестирование, локализация и организация мероприятий также являются работой, в которой участвуют многие люди в сообществе.

5.4 Самые многообещающие продукты с открытым исходным кодом

В перспективе продуктов с открытым исходным кодом интернет-продукты стали самым оптимистичным направлением развития продуктов с открытым исходным кодом для участников с долей 34%. Появились инструменты искусственного интеллекта и разработки, которые стали горячей точкой и горячей точкой в ​​текущих продуктах с открытым исходным кодом.

5.5 Способы коммуникации сообщества Open Source

Среди методов общения в сообществе WeChat и списки рассылки в настоящее время являются наиболее распространенными, а QQ также является важным инструментом мгновенного общения в Китае. Растущая доля новых инструментов коммуникации: Slack и Zoom также являются феноменами, за которыми стоит следить.

【Отзывы экспертов】

У Шэн: Интенсивное использование групп WeChat и QQ по-прежнему демонстрирует постоянные недостатки кругов с открытым исходным кодом, которым не хватает возможностей для международного общения и сотрудничества. Это также свидетельствует о том, что китайский язык по-прежнему остается единственным способом общения, который нравится большинству участников с открытым исходным кодом.

5.6 Отношения между сообществом и кодом

Почти 90% участников считают, что в сообществе с открытым исходным кодом ценность сообщества больше или равна коду, потому что сообщество, построенное вокруг кода, сделает код лучше.

【Отзывы экспертов】

Гао Ян: Рад видеть всеобщее признание ценности сообщества. На наш взгляд, здоровое сообщество гораздо важнее хорошего кода. Только здоровое, разнообразное и дружелюбное сообщество может способствовать устойчивому развитию проекта. быстро, группы людей идут далеко».

5.7 Возрастное распределение сообщества открытого исходного кода

В сообществе open source участники в возрасте 20-30 лет являются основным компонентом, на долю которого приходится более 60%.

【Отзывы экспертов】

У Шэн: среди участников открытого исходного кода много молодых разработчиков.С одной стороны, это отражает то, что участие Китая в открытом исходном коде относительно запоздало, и студенты, как группа с высокой пластичностью, с большей вероятностью будут следовать недавнему энтузиазму открытого исходного кода и выбирать участвовать в open source. Отсутствие разработчиков старше 35-40 лет положительно отражает нехватку старших инженеров в Китае. Из-за масштабного роста проектов с открытым исходным кодом в Китае это будет очень зависеть от увеличения доли этих людей.

5.8 Безопасность программного обеспечения с открытым исходным кодом

Почти 70% участников заявили, что не будут чувствовать себя незащищенными, но в то же время 25% участников заявили, что у них будут такие опасения, а вопросы безопасности ПО с открытым исходным кодом по-прежнему заслуживают нашего внимания.

【Отзывы экспертов】

сладкая картошка: Благодаря своему механизму программное обеспечение с открытым исходным кодом постоянно находит и поддерживает проблемы через сообщество открытого исходного кода, и его проблемы безопасности могут не быть главной заботой разработчиков. На самом деле, в дополнение к проблемам технической безопасности разработчики должны обратить внимание на соблюдение требований открытого исходного кода и другие проблемы безопасности лицензий.Юридический риск, связанный с конфликтами лицензий, имеет очень большое влияние и его трудно обнаружить, особенно для предприятий.Тем не менее, проверка соответствия используемого программного обеспечения с открытым исходным кодом так же важна, как и его техническая безопасность.

5.9 Роль создания в Китае фонда с открытым исходным кодом

Участники согласились с тем, что создание фонда с открытым исходным кодом в Китае имеет большое значение, что может способствовать продвижению концепции открытого исходного кода, культурного образования с открытым исходным кодом, созданию сообщества и созданию экосистемы с открытым исходным кодом, которая способствует раннему развитию и поддержке. проектов с открытым исходным кодом и помогает китайским сообществам открытого исходного кода разрабатывать ресурсы. Интеграция и оптимизация также помогают интегрироваться с международным сообществом открытого исходного кода.

【Отзывы экспертов】

Цзян Тао: В условиях глобальной технологической конкуренции и развития основных технологий с открытым исходным кодом в Китае большое значение имеет создание и развитие China Open Source Foundation с командных высот экосистемы с открытым исходным кодом. Благодаря развитию и росту Китайского фонда открытого исходного кода мы будем и впредь поощрять отечественные гигантские технологические компании и общественные силы к совместному созданию экологической среды для инноваций с открытым исходным кодом, инновационной силы Китая с открытым исходным кодом. Кроме того, в нынешних рыночных условиях, когда глобальная бизнес-модель с открытым исходным кодом становится все более и более зрелой, создание фонда с открытым исходным кодом может также направить отечественные и иностранные фонды и инвестиционные учреждения на инкубацию и поддержку открытого исходного кода, развитие открытого исходного кода Китая. "единороги", и в конечном итоге сформировать капитал, предприятия, бизнес-экосистема Китая с открытым исходным кодом с разработчиками в качестве основного органа, обмена и взаимной выгоды.

Гао Ян: В 2020 году будет запущен первый в Китае фонд с открытым исходным кодом Open Atom, который имеет большое значение для популяризации образования с открытым исходным кодом в Китае и общего процветания экосистемы с открытым исходным кодом. Мы с нетерпением ждем, когда Open Atom сможет стать связующим звеном с открытым исходным кодом, объединяя международные сообщества открытого исходного кода, связывая высококачественные ресурсы дома и за рубежом и помогая проектам с открытым исходным кодом расти и добиваться успеха.

6. Статус технологии разработчика

6.1 Язык разработки

Языки разработки становятся все более и более мощными.В тройку лидеров входят Java, JavaScript и Python, а рейтинги в основном такие же, как и в прошлом году.

【Отзывы экспертов】

Ван Вэй: Языки программирования — популярная тема, и рейтинги почти не изменились. Стоит отметить, что язык SQL, кажется, не имеет сильного смысла существования, но он очень практичен. Фактически, все основные данные в разделе данных GitHub в этом отчете основаны на SQL, что является важным базовым навыком, которым должны обладать разработчики.

6.2 Онлайн-инструменты для совместного редактирования документов

Среди онлайн-инструментов редактирования документов графитовые документы в настоящее время часто используются китайским сообществом открытого исходного кода, а вики по-прежнему являются инструментом совместной работы, используемым многими участниками.

6.3 Редактор

VS Code остается самым популярным редактором в этом году, за ним следуют vim и notepad++.

6.4 Инструменты контроля версий

Нет сомнений, что Git выделяется и имеет абсолютное преимущество. Многие участники до сих пор используют SVN, TFS и CVS.

6.5 База данных

Что касается использования базы данных, то неудивительно, что MySQL с большим отрывом лидирует, за ней следуют MongoDB и PostgreSQL.

6.6 Операционная система

В использовании операционных систем Windows, Linux и MacOS X доминируют в мире.

6.6 Инструменты для совещаний

Конференция Tencent в настоящее время является наиболее используемым инструментом конференций для участников, за ней следуют Zoom и DingTalk.

6.7 Инструмент для работы и обслуживания чата

В настоящее время подавляющее большинство участников не использовали инструменты управления и обслуживания чата для автоматизации управления проектами, а для тех, кто использовал такие инструменты, Hubot является наиболее часто используемым инструментом ChatOps.

6.8 Платформа с открытым исходным кодом

Если они хотят открыть исходный код своих собственных проектов, 87% участников заявили, что откроют исходный код своих проектов на GitHub, за ними следуют Gitee и Gitlab.

【Отзывы экспертов】

Цзян Тао: С быстрым развитием масштабов и коммерциализации открытого исходного кода платформы с открытым исходным кодом, как важная основа и система поддержки для проектов с открытым исходным кодом и экологии разработчиков, в будущем будут предоставлять больше услуг и сценариев приложений, а также будут развивать свои собственные характеристики. Недавно выпущенный CODE China в 2020 году как независимая сторонняя платформа с открытым исходным кодом будет ориентирован на AIOT для обеспечения оперативной поддержки и экологических услуг для большего количества проектов и разработчиков с открытым исходным кодом.

6.9 Технический форум

Zhihu и CSDN в настоящее время являются двумя самыми популярными техническими форумами среди участников, за ними следует StackOverflow, Open Source China и Blog Park также нравятся многим участникам.

7. Резюме и благодарность

При распространении и сборе этой анкеты было много ухабов, и окончательная презентация была лишь маленьким уголком мира с открытым исходным кодом, но имела большое значение. Нетрудно заметить, что структура открытого исходного кода в Китае меняется, и искра открытого исходного кода начинает зарождаться в прерии, и это непреодолимо. Я надеюсь, что этот отчет сможет привлечь больше сообщества и разработчиков.

Вопросы анкеты и отчетные документы отчета публикуются на платформе размещения кода, официальном веб-сайте Open Source Society и партнерской веб-платформе и распространяются на основе Creative Commons Attribution-ShareAlike 4.0 International (CC BY-SA 4.0) лицензионное соглашение. Если у вас есть какие-либо предложения или идеи по поводу дизайна вопросов анкеты и содержания отчета, вы можете отправить исправление на платформе размещения кода, чтобы дополнить и внести свой вклад в отчет. Один маленький шаг для вас, но огромный скачок для всего китайского сообщества открытого исходного кода.

Члены Китайской группы ежегодного отчета по открытому исходному коду Общества открытого исходного кода, принимавшие участие в заполнении вопросника для этого отчета: Ся Сяоя, Нин Цзэсинь; партнеры по сообществу: X-lab, Gitee, Microsoft Reactor. Спасибо приглашенным экспертам в области открытого исходного кода, и особенно каждому другу, который активно участвовал в нашем исследовании.

2. Статьи с данными GitHub

1 Обзор

1.1 Предыстория

В этом разделе для статистического анализа используются глобальные журналы событий GitHub (всего за 2020 г.).874 миллионастатей), увеличившись примерно на 546 млн в 2019 году.60%. Некоторые из анализируемых проектов были отмечены вручную, были выбраны отдельные разработчики и организации предприятий в Китае, а для анализа была построена научная и разумная математическая модель.

Согласно определению активности разработчиков и активности проектов статистика показывает, что общее количество активных проектов в 2020 году составляет примерно53,73 миллиона, что примерно на 39,72 млн больше, чем примерно 39,72 млн в 2019 году.35.3%; общее количество разработчиков GitHub в 2020 году составляетболее 56 миллионов, общее количество активных разработчиковоколо 14,46 млн., увеличившись с примерно 1,19 млн в 2019 году.около 21,2%.

1.2 Объяснение индикаторов

Название индикатора имея в виду
language Основной язык, используемый для разработки проекта
activity Активность проекта (рассчитывается по взвешиванию)
developer_count Количество разработчиков, участвующих в проекте по определению деятельности
issue_comment Общее количество комментариев, полученных в 2020 году по всем вопросам и PR проекта
open_issue Количество новых выпусков, добавленных проектом в 2020 году
open_pull Количество новых PR (pull request) проекта в 2020 году
pull_review_comment Количество отзывов по всем PR проекта в 2020 г.
merge_pull Количество ОР, объединенных проектом в 2020 г.
pull_commits Количество коммитов, которые проект включил через PR
pull_additions Количество строк кода, добавленных в проект через PR pulls
pull_deletions Количество строк кода, удаленных проектом через PR-слияния

2. Основное содержание и выводы

2.1 10 лучших проектов с открытым исходным кодом в мире

Наиболее активным проектом является фреймворк для кроссплатформенной разработки интерфейсов flutter/flutter от Google, кроме того, фреймворк глубокого обучения tensorflow/tensorflow от Google и система оркестровки контейнеров kubernetes/kubernetes также занимают 5-е и 6-е места соответственно, что показывает, что усилия и влияние Google на открытый исходный код были признаны в отрасли.

Кроссплатформенный редактор кода Microsoft microsoft/vscode и проект Microsoft с использованием открытого исходного кода для создания своей облачной платформы Azure MicrosoftDocs/azure-docs заняли второе и третье места соответственно, указывая на то, что усилия Microsoft в области открытого исходного кода получили одобрение программистов.

Как Microsoft / VSCode, так и определенным образом / определенно используют Teamscript в качестве основного языка программирования, который может иметь что-то с драматическим подъемом TypeScript.

2.2 50 лучших проектов Китая с открытым исходным кодом

В списке Top50 с точки зрения проектной активности разница между первой и 50-й проектной активностью составляет более 10 раз, что указывает на большой разрыв между китайскими проектами с открытым исходным кодом.

Из этого списка мы обнаружили, что Alibaba добилась замечательных достижений в области открытого исходного кода. В топ-10 входят 4 проекта, за исключением библиотеки компонентов Ant Financial ant-design/ant-design, упакованной React, и строительных лесов ant-design/ant-. В дополнение к design-pro и alibaba/nacos, набор функций, предназначенный для настройки и управления микросервисами, проект с открытым исходным кодом ElmFE/element компании Ele.me (который был приобретен Alibaba) также является отличным интерфейсным компонентом.

Производительность PingCAP в области открытого исходного кода также очень высока. В список Top50 входят 6 проектов, в том числе распределенная реляционная база данных с открытым исходным кодом pingcap/tidb, спроектированная и разработанная нами, распределенная транзакционная база данных "ключ-значение" tikv/tikv и проекты документации pingcap/docs-cn, pingcap/docs. и т. д., указывая на то, что PingCAP придает большое значение построению проектных документов. Стоит обратить внимание на проект pingcap/tidb, чьи свойства, такие как issue_comment, open_issue, pull_review_comment, merge_pull, являются самыми высокими среди 50 проектов, достигая поразительных 52 871 и 10 981. Напротив, свойство issue_comment занимает второе место в ant-design/. муравьиный дизайн составляет всего около 61,5% от него. Количество разработчиков, участвующих в его 480, далеко от числа других фронтенд-проектов, но у него такая высокая степень активности, которая также может показать активность его сообщества.

Производительность Baidu в области искусственного интеллекта очень высока.Его платформа глубокого обучения PaddlePaddle включает 6 проектов, а именно: базовую платформу Paddle и связанные с ней библиотеки инструментов, расширенные версии и библиотеки моделей. тоже в списке..

В список Top50 китайских проектов входят библиотека компонентов Ant-Design от Ali, фреймворк для разработки на основе фреймворка React от JD.com, библиотека компонентов Vue UI Element с открытым исходным кодом от Ele.me (приобретенная Ali) и т. д. Это показывает, что в Китае фронтенд-группа более активна в сообществе с открытым исходным кодом; кроме того, фронтенд-код обычно менее конфиденциальен, поэтому компания более открыта. Однако есть одна вещь, на которую следует обратить внимание: большинство библиотек компонентов внешнего интерфейса в списке отсутствуют в основных проектах.

Проекты, относящиеся к области искусственного интеллекта PaddlePaddle/Paddle, apache/incubator-tvm, Tencent/ncnn и alibaba/MNN, занимают место в списке 50 лучших проектов Китая, что свидетельствует об активном развитии крупных отечественных компаний в области искусственного интеллекта. искусственный интеллект.

2.3 Анализ ситуации с предприятиями с открытым исходным кодом в Китае

За крупными проектами с открытым исходным кодом в основном стоит поддержка со стороны технологических компаний.Мы подсчитали активность проектов с открытым исходным кодом, поддерживаемых технологическими компаниями в 2020 г. Результаты представлены в следующей таблице:

В открытых данных отечественных предприятий мы видим, что Alibaba занимает первое место по всем показателям, кроме показателя pull_review_comment.В индивидуальном балле Repo_count и Developer_count представляют собой сумму других компаний, а количество Open_issues также выше, чем у других компаний. , на порядок.

ИИ — это наиболее очевидная конкурентоспособность продуктов с открытым исходным кодом Baidu, таких как PaddlePaddle, платформа глубокого обучения с открытым исходным кодом в Китае, и Apollo, платформа для автономного вождения. Репозиторий 192, выпущенный Tencent на GitHub, в основном посвящен пяти техническим областям: облачным технологиям, большим данным, искусственному интеллекту, мобильной разработке и веб-разработке. Инвестиции Huawei в область открытого исходного кода очевидны для всех, но данные на GitHub не полностью продемонстрировали их силу, и здесь можно увидеть влияние китайско-американской макроторговой войны. Будучи развивающейся интернет-финансовой компанией, WeBank открыл исходный код 27 проектов и 44 репозитория, охватывающих такие области, как искусственный интеллект, блокчейн, облачные вычисления и большие данные.Это также финансовая компания, которая в первые дни создала офис с открытым исходным кодом. Didi активно продвигает открытый исходный код: был создан комитет по открытому исходному коду, который не только активно участвует в отраслевых проектах с открытым исходным кодом, но и активно открывает 38 репозиториев на GitHub. Среда рабочего стола Deepin DDE любима пользователями дома и за границей.В дополнение к собственной программной экосистеме, она также включает в себя тысячи настольных приложений в своем магазине приложений.Как отечественная частная операционная система Linux, она по-прежнему замечательна.

Во второй половине 2020 года PingCAP объявила о завершении финансирования серии D на сумму 270 млн долларов США, что стало новой вехой в истории глобальных баз данных. второе место в списке. Среди них количество pull_review_comment превышает количество Alibaba, но количество разработчиков меньше, чем 1/10 от числа Alibaba, Видно, что сообщество открытого исходного кода PingCAP очень активно.

Рейтинг Youzan вырос очень быстро, что может быть связано с отличной производительностью его проекта с открытым исходным кодом youzan/vant, который представляет собой легковесный мобильный компонент пользовательского интерфейса.

Стоит отметить, что новые компании социальных сетей, такие как Bilibili, douban и Nuggets, которые фокусируются на пользовательском контенте, также активно используют технологии с открытым исходным кодом.

Видно, что в последние годы ведущие китайские предприятия с открытым исходным кодом увеличивают инвестиции и строительство экологического сообщества с открытым исходным кодом.Предприятия в различных областях, таких как Интернет, операционные системы, сайты социальных сетей, финансы, облачные вычисления и электронная коммерция, активно участвуя, показывая сотни цветков пышности с открытым исходным кодом.

2.4 Apache Software Foundation — проект с открытым исходным кодом из Китая.

Фонд Apache Software Foundation (ASF) был основан в 1999 году, чтобы помочь отдельным лицам и организациям понять, как открытый исходный код может обеспечить преимущество на высококонкурентном рынке. Его внимание сосредоточено не на производстве программного обеспечения, а на наставничестве сообщества, которое производит программное обеспечение. Путь Apache имеет значительные преимущества для устойчивого развития сообщества открытого исходного кода: все, что мы поддерживаем, является открытым исходным кодом, и все пользователи могут извлечь из этого пользу. В настоящее время у Apache есть 14 проектов высшего уровня из Китая, а 7 проектов-инкубаторов усердно работают над тем, чтобы стать проектами высшего уровня.

В 2020 году Apache Software Foundation имеет в общей сложности 21 активный проект с открытым исходным кодом в Китае, 9 из которых вошли в шорт-лист 50 лучших китайских проектов с открытым исходным кодом.

Среди китайских проектов с открытым исходным кодом в рамках Apache Software Foundation наиболее активным является проект apache/shardingsphere.Apache ShardingSphere представляет собой экосистему, состоящую из промежуточного программного решения для распределенной базы данных с открытым исходным кодом.Он состоит из JDBC, Proxy и Sidecar (планирование). 3, проект стал проектом верхнего уровня Apache Foundation 16 апреля 2020 года.

Производительность apache/incubator-echarts и apache/skywalking также очень высока, занимая 10-е и 12-е место в рейтинге открытого исходного кода Китая соответственно. Apache ECharts — это бесплатная мощная библиотека для построения диаграмм и визуализации; SkyWalking — это платформа наблюдения и инструмент APM, который дополнительно работает с Service Mesh для предоставления автоматических метрик для микросервисов, облачных и контейнерных приложений, в настоящее время предоставляющих услуги мониторинга для Alibaba, Huawei, Tencent и другие отечественные производители. ECharts и SkyWalking также являются проектами высшего уровня Apach Software Foundation.

Из этих данных мы видим, что Apache, как один из самых активных фондов в мире, внес огромный вклад в китайское сообщество открытого исходного кода. С одной стороны, превосходные проекты Apache с открытым исходным кодом и гармоничная атмосфера сообщества, являясь основой высшего уровня, привлекают все больше и больше китайских проектов с открытым исходным кодом, чтобы присоединиться к нему; Добавляется все больше и больше китайских цветов, с нетерпением ожидая, когда китайские проекты с открытым исходным кодом устремятся на рынок. 10 лучших в мире проектов с открытым исходным кодом как можно скорее!

【Отзывы экспертов】

Чен Ян: Из измерения времени мы видим, что открытый исходный код Китая постепенно стал влиятельным и создателем из раннего последователя и участника, и сила открытого исходного кода Китая растет. В Китае стало появляться большое количество создателей проектов с открытым исходным кодом, проекты китайских предприятий с открытым исходным кодом стали передаваться в фонд для инкубации, Китай начал определять собственное лицензионное соглашение с открытым исходным кодом (расслабленное соглашение Мулана) и был принят OSI, и Китай начал создавать китайский фонд открытого исходного кода (Open Atom Foundation), это очень важные признаки того, что открытый исходный код Китая начал созревать.

Лю Тяньдун: В 2015 году Open Source Society и ASF совместно провели Apache China Roadshow.На тот момент в ASF было всего 3 проекта с открытым исходным кодом из Китая (Kylin, Eagle, Griffin of Ebay China Research Institute), и в течение 6 лет , они выросли до 21 (включая 14 проектов высшего уровня, выпущенных инкубаторами ASF). Синяя нить дороги, взлеты и падения капают в сердце. Мечта о том, чтобы базироваться в Китае и приносить пользу миру, уже в пути!

2.5 Посещение ведущих китайских проектов с открытым исходным кодом

Ма Янцзюнь (старший директор отдела платформы технологий глубокого обучения Baidu, PaddlePaddle/Paddle)

Приятно видеть PaddlePaddle в 2020 году, продолжая список очень активных проектов 2019 года в Китае.

Фреймворк глубокого обучения является ядром экосистемы искусственного интеллекта с открытым исходным кодом.Техническая сложность очень высока, и его необходимо постоянно шлифовать с медленной работой в сочетании с приложениями. Как самая ранняя платформа с открытым исходным кодом и наиболее полная платформа глубокого обучения в моей стране, Paddle всегда придерживалась концепции открытости и прозрачности разработки с открытым исходным кодом. В сочетании с потребностями развития индустрии ИИ, Flying Paddle поддерживает перспективный общий дизайн с точки зрения общего дизайна структуры и инструментов разработки всего процесса, поддерживает максимальное стремление к инженерному качеству и эффективно гарантирует качества через механизм сообщества, среди них сформировалась хорошая репутация.

Paddle всегда очень заботился о вкладе и признании разработчиков в сообщество. В настоящее время Feipao насчитывает более 5000 разработчиков с открытым исходным кодом, которые вносят свой вклад посредством PR или поднятия вопросов, и поощряет больше разработчиков вносить свой вклад с помощью стратегий, обмена мнениями в сообществе и других методов. На все проблемы разработчиков в процессе использования будет быстро реагировать сообщество, и они также будут включены в выпуск новой версии.Благодаря такой непрерывной полировке с обратной связью качество проекта гарантировано и постоянно улучшается в лучшую сторону. удовлетворить потребности большинства разработчиков ИИ. Спрос на использование также позволил большинству разработчиков сформировать более сильное чувство принадлежности к сообществу.

Фреймворк глубокого обучения занимает связующее положение в стеке технологий ИИ.Очень важно подключить чип вниз и запустить приложение вверх. Таким образом, Paddle установила тесные отношения сотрудничества с производителями оборудования, и многие производители микросхем напрямую предоставили код сообществу Paddle, внося большой вклад в экологическое развитие Paddle. Paddle также продолжает тесно сотрудничать с крупными организациями с открытым исходным кодом и сообществами ИИ и стала их важным членом при поддержке сообщества OpenI. Через экспертов разработчиков PaddlePaddle (PPDE), SIG и другие организационные формы способствуют углубленному общению и взаимодействию с разработчиками, а также росту вместе с разработчиками сообщества.

У Шэн (Apache/прогулки по небу)

В этом году Apache SkyWalking стремительно развивался: языковые тесты охватывают все основные языки программирования, включая Java, .NetCore, Golang, PHP, NodeJS, Python, C++ и LUA для Nginx. Общие показатели активности сообщества, такие как количество звезд, количество участников и количество PR, удвоились по сравнению с 2019 годом.

Производители пользователей SkyWalking охватывают практически всех отечественных производителей и формируют собственную стандартную систему. Все основные поставщики облачных услуг, а также облачные APM-сервисы Alibaba Cloud и Tencent Cloud полностью поддерживают протокол передачи SkyWalking. В то же время SkyWalking также установила беспрепятственное соединение с основными экосистемами мониторинга, такими как OpenTelemetry, Prometheus и OpenCensus.

В этом году сотрудничество SkyWalking Community и Summer 2020 было очень успешным: 2 онлайн-аспиранта стали официальными коммиттерами. Выступление этих двух студентов на мероприятии показало потенциал студенчества в высшей программе. Это совершенно новый вид по сравнению с 2019 годом. Это также демонстрирует ценность и значение систематической программы инкубации студентов. Надеемся, что в будущем мы увидим больше и лучше программ инкубации и сотрудничества для студентов, включая уже выпущенное лето 2021 года.

В процессе глобализации, в рамках нейтральности Apache по отношению к поставщикам, проект SkyWalking плавно развивается в рамках асинхронной и диверсифицированной модели сотрудничества в разных регионах и часовых поясах. Проект SkyWalking стал основным компонентом проектов коммерциализации многих отечественных и зарубежных компаний (Азия, Европа, Северная Америка), к проекту присоединились все больше профессиональных разработчиков. Это приносит огромную активность и скорость итерации в экологию проекта. SkyWalking быстро взрослеет и развивается в своем собственном темпе вместе с отечественными и зарубежными коммерческими производителями, отдельными разработчиками и вторичными командами разработчиков компании.

Хуан Дунсюй (технический директор PingCAP, pingcap/tidb, tikv/tikv)

Деятельность сообщества TiDB в этом году можно разделить на две части: пользователи и разработчики. С точки зрения бизнеса его можно разделить на полировку и улучшение проекта, обучение талантов и экологическое строительство, анализ пользовательских сценариев и успех в бизнесе. Поэтому, чтобы управлять хорошим сообществом с открытым исходным кодом, самое главное — быть ориентированным на людей и расти вместе с ними.

Для сообщества TiDB прошедший год был отмечен быстрым развитием: в прошлом году TiDB 4.0 официально запустила колоночный движок TiFlash. Уверенный шаг на пути к HTAP в реальном времени. По нашим данным, почти 1/3 кластеров 4.0 используют TiFlash. Объясните, что распространено требование делать анализ данных в реальном времени непосредственно на данных TP.

Среди них мы можем почувствовать, что внутренняя атмосфера открытого исходного кода и активность разработчиков также постепенно улучшаются.С 500+ участников в конце 2019 года до конца 2020 года число достигло 1200+, и всеобщее участие и понимание Количество проектов с открытым исходным кодом также увеличивается.В сообществе TiDB собирается все больше и больше разработчиков, которые соединяют восходящие и нисходящие отрасли через TiDB и делятся инновационными достижениями. С операционной точки зрения TiDB существуют некоторые основные принципы процветания сообщества открытого исходного кода: прозрачность, открытость, совместное использование и т. д. Например: все наши обсуждаемые документы, направления развития, голосование, выборы — все открыто, Прозрачно. , все участники сообщества могут участвовать; во-вторых, мы также сформулировали некоторые основные правила и структуры управления сообществом, а также сделали несколько автоматизированных сервисов ботов с точки зрения инфраструктуры, чтобы помочь большему количеству разработчиков в сообществе получить лучший опыт и ощущения; наконец, через некоторые открытые и прозрачные стимулы и обратная связь, чтобы привлечь больше разработчиков к активному участию.

3. Тематическое исследование - АЧС

3.1 Введение

Apache Software Foundation (ASF), созданная в 1999 году, является некоммерческой общественной благотворительной организацией, учрежденной в США в соответствии со статьей 501(c)(3). Фонд обязуется:

  • Предоставить инфраструктуру: предоставить аппаратное обеспечение, коммуникационную инфраструктуру и инфраструктуру управления проектами для проектов с открытым исходным кодом;
  • Предоставить юридическое лицо для пожертвований: создать отдельное юридическое лицо, которому компании и физические лица могут жертвовать ресурсы и гарантировать, что эти ресурсы будут использоваться для общественного блага;
  • Обеспечить правовую защиту: Обеспечить правовую защиту для отдельных добровольцев, чтобы избежать судебных разбирательств против проектов фонда;
  • Обеспечивает защиту торговой марки Apache: защищает торговую марку «Apache» для своих программных продуктов от неправомерного использования другими организациями.

Миссия Apache Software Foundation — предоставлять программное обеспечение для общественного блага. Фонд помогает отдельным лицам и организациям понять, как открытый исходный код может дать преимущество на высококонкурентном рынке. Его внимание сосредоточено не на производстве программного обеспечения, а на наставничестве сообщества, которое производит программное обеспечение. В рамках меритократического процесса, известного как «Путь Apache», более 800 отдельных участников и 7000 коммиттеров успешно сотрудничают для разработки бесплатного программного обеспечения корпоративного уровня, которое приносит пользу миллионам пользователей по всему миру. Apache — это Apache для всех.

3.2 Путь апачей

«Путь Apache» — это набор моделей поведения или соглашений, разработанных ASF для первоначального продвижения долгосрочных успешных проектов путем сосредоточения внимания на стабильном управлении и поощрении новых участников. Все проекты Apache должны следовать этим основным принципам:

  • Здоровое, разнообразное и инклюзивное сообщество, которое способствует развитию устойчивых программ. Сообщество важнее кода: ASF всегда считала, что хорошее программное обеспечение создается сильным сообществом.
  • Заработанные власти: у каждого есть возможность участвовать, и их влияние основано на публично заработанном заслугах, то есть их вклад в сообщество. Заслуга является личным, не истекает, не зависит от статуса занятости или работодателя, а не передается.
  • Плоская структура ASF: в сообществе Apache все уважают друг друга, роли равны, голоса каждого имеют равный вес, а участники пользуются теми же правами, что и другие, на добровольной основе (даже если организация обслуживает их на платной основе за работу над Apache). код).
  • Большинство списков рассылки Apache заархивированы и общедоступны для обеспечения автоматического сотрудничества, что необходимо для глобального сообщества.
  • Поскольку полный консенсус не может быть достигнут в любое время, на этом этапе может потребоваться традиционное обязательное голосование или другие средства координации, чтобы помочь устранить барьеры на пути принятия решений.
  • Подотчетный надзор: модель управления ASF основана на доверии и уполномоченном надзоре, что позволяет проектам быть автономными и отчитываться непосредственно перед советом директоров. Коммиттеры Apache помогают друг другу: оценивают коммиты друг друга, внедряют обязательные меры безопасности, обеспечивают соответствие лицензии и защищают бренд Apache и все сообщество от вреда.

3.3 Анализ данных

Мы подсчитали активность всех 21 склада проекта ASF, расположенных в Китае, следующим образом.

Мы подсчитали рабочее время всех складов проекта ASF, расположенных в Китае, и построили график распределения рабочего времени для каждого склада. Здесь мы выбираем три проекта с очевидными характеристиками распределения рабочего времени для простого анализа.

  • apache/carbondata, Apache CarbonData — это новое конвергентное решение для хранения данных, в котором используются передовые методы столбцового хранения, индексирования, сжатия и кодирования для повышения эффективности вычислений, что приводит к более быстрым запросам, которые выполняются на порядок быстрее, чем данные PetaBytes.

  • apache/incubator-teaclave, универсальная безопасная вычислительная платформа с открытым исходным кодом, которая делает вычисления безопасными и простыми для конфиденциальных данных.

  • apache/hadoop-ozone, Ozone — это масштабируемое, избыточное и распределенное хранилище объектов для Hadoop.

Очевидно, что в трех вышеприведенных проектах углеродные данные находятся не в часовом поясе UTC+8, а в часовых поясах UTC+4 и 5, это связано с тем, что его главный сопровождающий Равиндра Песала — индиец, что соответствует часовому поясу; teaclave полностью американское время, Китай почти молчит в течение дня.Хотя это проект, подаренный Baidu, его сопровождающий Mingshen Sun фактически находится на западном побережье Соединенных Штатов, а не в Китае; для сравнения, hadoop-ozone очевидно, лучший проект, сделанный глобализацией.

4. Тематическое исследование - CNCF

4.1 Введение

CNCF расшифровывается как Cloud Native Computing Foundation и является частью Linux Foundation. CNCF размещает ключевые компоненты глобальной технологической инфраструктуры, объединяя ведущих мировых разработчиков, конечных пользователей и поставщиков.

4.2 Процесс предложения

CNCF установила политику управления процессом подачи проектных предложений, которая применяется к существующим проектам, которые должны быть добавлены в CNCF, и к новым проектам, формируемым в рамках CNCF.

  • Песочница: все исключения (включая отклонения) обрабатываются TOC (полное название — Комитет по техническому надзору, сокращение от Комитета по техническому надзору, который в основном обеспечивает техническое руководство сообществом облачных разработчиков). Когда программа отклонена, это может быть «неуместной в настоящее время» ситуацией, и программе может быть предложено повторно подать заявку после того, как проблема будет решена. Время, необходимое для всего процесса, не является фиксированным. В настоящее время на этом этапе находится 44 проекта, таких как Artifact Hub и Backstage.
  • Инкубация: так же, как и в песочнице, все исключения (включая отклонения) обрабатываются TOC. В настоящее время на этом этапе находятся проекты Argo, Buildpacks, CloudEvents, CNI, Contour, Cortex, CRI-O, Dragonfly, Falco, gRPC, KubeEdge, Linkerd, NATS, Notary, Open Policy Agent, OpenTracing, Operator Framework, SPIFFE, SPIRE, Thanos. Ждать.
  • Выпуск: в том числе отправка шаблона предложения об окончании, начало двухнедельного общественного обсуждения членами ТОС в списке рассылки ТОС и голосование ТОС. В настоящее время на этом этапе находятся проекты containerd, CoreDNS, Envoy, etcd, Fluentd, Harbour, Helm, Jaeger, Kubernetes, Prometheus, Rook, TiKV, TUF, Vitess и др.

CNCF проводит выпускные, инкубационные и изолированные проекты. Хотя CNCF предоставляет набор общих услуг для всех проектов, она не предоставляет существенных маркетинговых услуг для проектов-песочниц, поскольку они являются проектами на ранней стадии, требующими легкой нейтральности для естественного роста проектов. Приоритет проектной службы проектов-песочниц ниже, чем у инкубационных и выпускных одноранговых проектов.

4.3 Анализ данных

Мы подсчитали активность всех выпускных и инкубационных репозиториев проекта CNCF, и данные следующие.

Мы подсчитали рабочее время складов проекта CNCF, и диаграммы, составленные для каждого склада, выглядят следующим образом.

  • kubernetes/kubernetes, Kubernetes — это система с открытым исходным кодом для автоматического развертывания, масштабирования и управления контейнерными приложениями. Он объединяет контейнеры, из которых состоит приложение, в логические единицы для упрощения управления и поиска служб.

  • thanos-io/thanos, Thanos — это набор компонентов, которые составляют высокодоступную установку Prometheus с долговременным хранилищем. Его основная цель — упростить операции и сохранить надежность Prometheus.

  • kubeedge/kubeedge

Распределение рабочего времени разработчиков трех вышеупомянутых проектов имеет очевидную агрегацию часовых поясов. Среди них большинство разработчиков kubernetes находятся вблизи часового пояса UTC-5, то есть Северной и Южной Америки, в то время как большинство разработчиков thanos — это европейские разработчики, а разработчики kubeedge — в основном разработчики из Азиатско-Тихоокеанского региона. . В распределении рабочего времени kubeedgede мы можем обнаружить, что у разработчиков есть привычка брать перерыв на обед: в 4-5 часов по времени UTC и около 12-13 часов по местному времени рабочая нагрузка разработчиков резко падает.

5. Практический пример — LF AI и данные

5.1 Введение

LF AI & Data — это всеобъемлющий фонд в рамках Linux Foundation, который поддерживает инновации с открытым исходным кодом в области искусственного интеллекта, машинного обучения, глубокого обучения и данных. Целью создания LF AI & Data является поддержка искусственного интеллекта с открытым исходным кодом, машинного обучения, глубокого обучения и данных, а также создание устойчивой экосистемы искусственного интеллекта с открытым исходным кодом, которая позволяет легко создавать продукты и услуги искусственного интеллекта и данных с использованием открытого исходного кода. технологии. Он включает в себя членство и управление казначейством, развитие экосистемы, юридическую поддержку, PR/маркетинг/коммуникации, поддержку мероприятий и проверку соответствия, а также предоставление открытых проектов разработки в разнообразном и процветающем сообществе, в дополнение к ряду дополнительных услуг поддержки.

В настоящее время проекты, выпущенные LF AI & Data Foundation, включают:Acumos,Angel-ML,Egeria,Horovod,ONNX.

Инкубационные проектыAdlik,Adversarial Robustness Toolkit,AI Explainability 360 Toolkit,AI Fairness 360 Toolkit,Amundsen,DataPractices,DELTA,Elastic Deep Learning (EDL),Feast,ForestFlow,JanusGraph,Ludwig,Marquez,Milvus,NNStreamer,OpenDS4All,Pyro,SOAJS,sparklyrЖдать.

5.2 Процесс предложения

Чтобы войти в LF AI & Data Foundation, требуется предложение. Процесс предложения проекта одинаков для существующих проектов, пытающихся войти в LF AI & Data Foundation, а также для новых проектов, которые будут сформированы в рамках LF AI & Data Foundation.

Проекты должны быть предложены через GitHub и отправлены наinfo@lfaidata.foundationОтправьте электронное письмо с темой «ПРЕДЛОЖЕНИЕ [название проекта]», чтобы уведомить участников LF AI & Data.

После подачи проектного предложения процесс утверждения делится на четыре этапа.

  • шаг 1:
    • Предметы предоставляются в соответствии сшаблонПодготовьте предложение и отправьте его через GitHub с коротким письмом по адресуinfo@lfai.foundation, тема "ПРЕДЛОЖЕНИЕ [название проекта]".
    • Проекты, представляемые компанией, должны подписать и предоставить копию Соглашения о передаче товарного знака и учетной записи; цель этого соглашения — передать право собственности и управление товарным знаком проекта учетной записи проекта Linux Foundation.
    • Члены LF AI & Data уведомят проект, если предложение готово для подачи в TAC, и будут работать с проектом, чтобы завершить подачу предложения, рассмотрение и голосование.
  • Шаг 2:
    • Программа будет представлена ​​TAC посредством телеконференций на встречах, проводимых раз в две недели.
    • У спикеров будет 45 минут, чтобы выступить и представить актуальную информацию.
    • Презентационные документы должны быть утверждены не менее чем за 3 рабочих дня до запланированной телефонной конференции.info@lfaidata.foundationОтправлено в LF AI & Data, чтобы обеспечить достаточное время для рассмотрения членами TAC.
    • У TAC будет 15 минут для обсуждения с представителями проекта, после чего будет проведено голосование, чтобы определить принятие проекта и этап, на котором проект будет размещен в LF AI & Data.
  • Шаг 3: Если программа одобрена TAC на уровне выпускника.
    • Направить предложение в ГБ на утверждение.
    • Представители проекта будут приглашены на следующую телеконференцию GB для коротких презентаций (10 минут), после чего GB проголосует за принятие проектов выпускного уровня.
  • Шаг 4: Объявите и присоединяйтесь
    • Объявление о размещении проекта LF AI & Data в блоге или пресс-релизе
    • Присоединение к проекту. После утверждения нового проекта члены LF AI & Data помогут проекту присоединиться к фонду и начнут оказывать необходимую поддержку в основной области. Члены LF AI & Data предоставят проекту подробную информацию и сроки каждого действия.

5.3 Анализ данных

Мы подсчитали активность всех складов проекта LF AI & Data, данные следующие:

Мы подсчитали время работы складов проекта LF AI & Data и нарисовали графики для каждого склада. Здесь мы выбираем 3 элемента для анализа.

  • milvus-io/milvus, Milvus предназначен для приближенного поиска ближайшего соседа (ANNS) массивных собственных векторов. По сравнению с библиотеками операторов, такими как Faiss и SPTAG, Milvus предоставляет полную структуру обновления векторных данных, индексации и запросов. Milvus использует GPU (Nvidia) для ускорения индексации и ускорения запросов, что может значительно повысить производительность одной машины.

  • odpi/egeria

  • nnstreamer/nnstreamer, NNStreamer — это набор подключаемых модулей Gstreamer, который обеспечивает удобную и эффективную поддержку разработчиков Gstreamer, работающих с моделями нейронных сетей, и разработчиков нейронных сетей, управляющих конвейерами нейронных сетей и их фильтрами.

Можно обнаружить, что существуют различия в распределении рабочего времени разработчиков между тремя проектами. Разработчики milvus-io/milvus активны с понедельника по субботу, и их рабочее время в основном распределено по часовому поясу UTC+8, что указывает на то, что разработчики этого проекта в основном азиатские разработчики; разработчики odpi/egeria в основном сосредоточены в Часовой пояс UTC+ 0, то есть большинство разработчиков в Европе, но в 0:00, неважно в выходные или будни, генерируется большое количество событий, почти наверняка в этом проекте используются автоматизированные коллаборативные роботы, и много задач по расписанию выполняются в 0:00; nnstreamer Время работы разработчиков /nnstreamer в основном с понедельника по пятницу, расположено в часовом поясе UTC+8, что указывает на то, что разработчики этого проекта в основном азиатские разработчики, а разработчики работают по выходным .

6, тематические исследования - Wuhan2020

6.1 Введение

Wuhan2020Это представитель более масштабной самоорганизации, появившейся во время эпидемии COVID-19, а также одно из типичных технических самоорганизующихся сообществ. Wuhan2020 начала волонтерскую деятельность и сотрудничество в Интернете с открытым исходным кодом менее чем через 3 месяца после своего основания. Онлайн-волонтеры совместно создали 5 веб-страниц/веб-сайтов, 23 репозитория кода на GitHub и собрали 4394 элемента различной первичной и вторичной информации, связанной с борьбой с COVID-19.

Согласно неполной статистике самоорганизующихся организаций, по состоянию на 20 мая 2020 года пять страниц/веб-сайтов Wuhan2020 насчитывали более 300 000 посещений. Сбор данных, разрешенных для чтения и публичного использования, способствовал обмену данными между больницами и сообществами в Ухане и близлежащих городах, обеспечиваемому Ассоциацией помощи выпускникам Оксбриджа, помощи команде Gliding Eagle в Силиконовой долине и глобальному Платформа медицинской информационной службы в Соединенных Штатах и ​​​​т. д. достигнута. На данный момент Wuhan2020 стал одним из немногих самоорганизованных представителей, которые объявили о нормализации и завершили строительство постоянной организационной структуры в борьбе с новой эпидемией коронной пневмонии.

6.2 Анализ принадлежности

По состоянию на 20 мая 2020 года сообщество открытого исходного кода Wuhan2020 определило 4095 участников, подсчитав их адреса электронной почты. Впоследствии сертификаты волонтеров были выданы через почтовые ящики волонтеров, и в общей сложности сертификаты волонтеров Wuhan2020 получили 1942 человека.

【Все типы почтовых ящиков в сообществе, всего 4095】

[Добровольцы получили сертификат типа почтового ящика, общее количество 1942]

По типу почтового ящика и другим данным можно приблизительно оценить род занятий и возрастное соотношение членов сообщества. Например: почтовые ящики Education используются учителями, участвующими в Wuhan2020, а пользователи почтовых ящиков QQ в основном старше 95 лет.

Кроме того, было обнаружено, что существует 16 почтовых ящиков Али, 5 почтовых ящиков Люлишо, 4 почтовых ящика Цзиндун, а также Шиши, ПрайсвотерхаусКуперс и т. д. Это почтовые ящики, используемые корпоративным персоналом.

На начальном этапе проекта «Ухань 2020» было собрано в общей сложности 1 606 единиц информации о роде занятий и образовании добровольцев, согласно собранной информации о добровольцах, эта часть добровольцев использовалась в качестве выборки для анализа участников.

))

【Профессиональный анализ членов сообщества】

Разница между двумя приведенными выше рисунками заключается в том, что порядок занятий на горизонтальной оси различен.Цель этого дизайна состоит в том, чтобы различать членов сообщества с несколькими профессиональными идентичностями. Количество членов множественной идентичности рассчитывается путем вычитания определенной профессиональной категории на левом изображении из определенной профессиональной категории на правом изображении.

[Разбивка текущих академических квалификаций студентов, всего 853]

Поскольку при заполнении профессий больше людей являются студентами, только те, кто соответствует определенным академическим квалификациям, кроме студентов, могут быть проанализированы только в качестве выборки и не обязательно являются репрезентативными.

Его можно дополнительно разбить по академической квалификации членов сообщества, включая тех, кто получил высшее образование.

【Обучение членов сообщества, всего 1606】

Из приведенного выше рисунка видно, что наиболее академически образованными членами сообщества являются студенты.Объединяя информацию о профессии и информацию об электронной почте предыдущих членов сообщества, можно сделать вывод, что большинство участников сообщества открытого исходного кода Wuhan2020 находятся в 95- возрастная группа 05. студент. Значительная часть тех, кто использует почтовые ящики Gmail, приехали из-за границы, и доля этих участников, получающих добровольные сертификаты, относительно невелика.

[Члены сообщества хорошо разбираются в круговой диаграмме доменов, всего 1606]

Судя по результатам анализа областей знаний членов сообщества, когда члены сообщества выбирают свои области знаний, они будут больше выбирать области рекламы или дизайна, что объясняет, почему в рекламной команде Wuhan2020 серьезный избыток членов, и могут быть многие члены рекламной группы остаются в сообществе после мероприятия. Это, конечно, также связано с тем, что большинство источников данных поступают из WeChat, а не Slack, В GitHub и Slack больше программистов или инженеров будут напрямую участвовать в проекте, не заполняя формы.

7. Резюме и благодарность

Данные, методы анализа и результаты анализа всего контента в этой части поддерживаются открытой лабораторией X-lab.Члены команды, которые внесли свой вклад в написание контента, включают: Ван Хаоюэ и Чжу Сяннин.Часть «Анализ случая - Ухань 2020» это сообщество открытого исходного кода Wuhan2020, написанное генеральным директором Ли Яном. Спасибо приглашенным экспертам в области открытого исходного кода, и особенно каждому другу, который активно участвовал в нашем исследовании.

утверждение:

Отказ от ответственности: этот отчет получен из открытого исходного кодаобщество с открытым исходным кодомРазрешено перепечатывать, эта статья ограничена размером выбранных выдержек, пожалуйста, загрузите полный отчетPDFизучать.