作家
登录

2017年哪个公司对开源贡献最多?让我们用GitHub的数据分析下

作者: 来源: 2017-11-14 14:13:34 阅读 我要评论

  •     WHERE domain NOT IN UNNEST(SPLIT('gmail.com|users.noreply.github.com|qq.com|hotmail.com|163.com|me.com|googlemail.com|outlook.com|yahoo.com|web.de|iki.fi|foxmail.com|yandex.ru''|')) # email hosters 
  •     GROUP BY 1 
  •     HAVING githubers > 30 
  •   ) 
  •   WHERE (SELECT MAX(githubers_from_domain) FROM (SELECT repo, COUNT(*) githubers_from_domain FROM UNNEST(repos) repo  GROUP BY repo))>4 # second filter email hosters 
  • ORDER BY githubers DESC 
  • FAQ

    有的公司有 1500 个仓库,为什么只统计了 200 个?有的仓库有 7000 个星标,为什么只显示 1500 个?

    1. SELECT *, REGEXP_WordStr(REGEXP_EXTRACT(email, r'@(.*)'), r'.*.ibm.com', 'ibm.com') domain 

    2017年哪个公司对开源供献最多?让我们用GitHub的数据分析下

    2017年哪个公司对开源供献最多?让我们用GitHub的数据分析下

    这注解了开源的成长形势么?

    留意,这个对 GitHub 的分析没有包含像 Android、Chromium、GNU、Mozilla 等顶级社区,也没有包含 Apache 基金会或 Eclipse 基金会,还有一些其它项目选择在 GitHub 之外开展起晃荡。

    这对于我的组织不公平

    我只能统计我所看到的数据。迎接对我的统计的前提提出看法,以及对我的统计办法给出改进办法。如不雅有能用的萌芽语句就更好了。

    举个例子,要看看当我归并了 IBM 的各个地区域名到其顶级域时排名产生了什么变更,可以用一条 SQL 语句解决:

    2017年哪个公司对开源供献最多?让我们用GitHub的数据分析下

    2017年哪个公司对开源供献最多?让我们用GitHub的数据分析下

    当归并了其地区域名后, IBM 的相对地位明显上升了。

    回音

    关于“ GitHub 2017 年顶级供献者”的一些思虑

    我以前犯过缺点,并且今后也可能再次掉足。请查看所有的原始数据,并质疑我的前提假设——看看你能获得什么结论是很有趣的。

    • 用一下交互式 Data Studio 申报

    感激 Ilya Grigorik 保存的 GitHub Archive 供给了这么多年的 GitHub 数据!

    【编辑推荐】

    1. 安然专家必定要存眷的19个开源GitHub项目
    2. GitHub将开源内部负载均衡软件
    3. Github上10 个最风行的数据可视化项目
    4. 玩转GitHub的问题单(issue)
    5. 关于GitHub的DNS基本举措措施,你懂得吗?
    【义务编辑:未丽燕 TEL:(010)68476606】

      推荐阅读

      如何分析博客中最流行的编程语言

    Tech Neo技巧沙龙 | 11月25号,九州云/ZStack与您一路商量云时代收集界线治理实践 摘要:这篇文┞仿我们将对一些各类各样的博客的风行度相对于他们在谷歌上的排名进行一个分析。所有代码可>>>详细阅读


    本文标题:2017年哪个公司对开源贡献最多?让我们用GitHub的数据分析下

    地址:http://www.17bianji.com/lsqh/38843.html

    关键词: 探索发现

    乐购科技部分新闻及文章转载自互联网,供读者交流和学习,若有涉及作者版权等问题请及时与我们联系,以便更正、删除或按规定办理。感谢所有提供资讯的网站,欢迎各类媒体与乐购科技进行文章共享合作。

    网友点评
    自媒体专栏

    评论

    热度

    精彩导读
    栏目ID=71的表不存在(操作类型=0)