FAQ
有的公司有 1500 个仓库,为什么只统计了 200 个?有的仓库有 7000 个星标,为什么只显示 1500 个?
- SELECT *, REGEXP_WordStr(REGEXP_EXTRACT(email, r'@(.*)'), r'.*.ibm.com', 'ibm.com') domain
这注解了开源的成长形势么?
留意,这个对 GitHub 的分析没有包含像 Android、Chromium、GNU、Mozilla 等顶级社区,也没有包含 Apache 基金会或 Eclipse 基金会,还有一些其它项目选择在 GitHub 之外开展起晃荡。
这对于我的组织不公平
我只能统计我所看到的数据。迎接对我的统计的前提提出看法,以及对我的统计办法给出改进办法。如不雅有能用的萌芽语句就更好了。
举个例子,要看看当我归并了 IBM 的各个地区域名到其顶级域时排名产生了什么变更,可以用一条 SQL 语句解决:
当归并了其地区域名后, IBM 的相对地位明显上升了。
回音
关于“ GitHub 2017 年顶级供献者”的一些思虑
我以前犯过缺点,并且今后也可能再次掉足。请查看所有的原始数据,并质疑我的前提假设——看看你能获得什么结论是很有趣的。
- 用一下交互式 Data Studio 申报
感激 Ilya Grigorik 保存的 GitHub Archive 供给了这么多年的 GitHub 数据!
【编辑推荐】
- 安然专家必定要存眷的19个开源GitHub项目
- GitHub将开源内部负载均衡软件
- Github上10 个最风行的数据可视化项目
- 玩转GitHub的问题单(issue)
- 关于GitHub的DNS基本举措措施,你懂得吗?
推荐阅读
Tech Neo技巧沙龙 | 11月25号,九州云/ZStack与您一路商量云时代收集界线治理实践 摘要:这篇文┞仿我们将对一些各类各样的博客的风行度相对于他们在谷歌上的排名进行一个分析。所有代码可>>>详细阅读
本文标题:2017年哪个公司对开源贡献最多?让我们用GitHub的数据分析下
地址:http://www.17bianji.com/lsqh/38843.html
1/2 1