如何使用 github api 检索存储库的所有贡献者

2022-09-04 23:19:07

我正在尝试使用此github api获取存储库的所有贡献者。

如果我没有错的话,它还告诉我,如果一个存储库有超过500个贡献者,它只给出了其中的500个,其余的都被标记为匿名。

出于性能原因,存储库中只有前 500 个作者电子邮件地址将链接到 GitHub 用户。

这个repo linux内核有5000多个贡献者,根据api,我应该通过api获得至少500个贡献者。

当我做curl -I https://api.github.com/repos/torvalds/linux/contributors?per_page=100

我只得到3页(per_page = 100),所以我得到了>300个贡献者。(查看“链接”标题)

有没有办法获得存储库的所有贡献者(5000 +)?

HTTP/1.1 200 OK
Server: GitHub.com
Date: Thu, 19 Nov 2015 18:00:54 GMT
Content-Type: application/json; charset=utf-8
Content-Length: 100308
Status: 200 OK
X-RateLimit-Limit: 60
X-RateLimit-Remaining: 56
X-RateLimit-Reset: 1447958881
Cache-Control: public, max-age=60, s-maxage=60
Last-Modified: Thu, 19 Nov 2015 16:06:38 GMT
ETag: "a57e0f74fc68e1791da15d33fa044616"
Vary: Accept
X-GitHub-Media-Type: github.v3
Link: <https://api.github.com/repositories/2325298/contributors?per_page=100&page=2>; rel="next", <https://api.github.com/repositories/2325298/contributors?per_page=100&page=3>; rel="last"
X-XSS-Protection: 1; mode=block
X-Frame-Options: deny
Content-Security-Policy: default-src 'none'
Access-Control-Allow-Credentials: true
Access-Control-Expose-Headers: ETag, Link, X-GitHub-OTP, X-RateLimit-Limit, X-RateLimit-Remaining, X-RateLimit-Reset, X-OAuth-Scopes, X-Accepted-OAuth-Scopes, X-Poll-Interval
Access-Control-Allow-Origin: *
Strict-Transport-Security: max-age=31536000; includeSubdomains; preload
X-Content-Type-Options: nosniff
Vary: Accept-Encoding
X-Served-By: a30e6f9aa7cf5731b87dfb3b9992202d
X-GitHub-Request-Id: 67E881D2:146C9:24CF1BB3:564E0E55

答案 1

由于GitHub API似乎不支持此功能,因此另一种方法(一种慢得多的方法)是克隆存储库,然后运行以下命令(以获取名称):

git log --all --format='%aN' | sort -u

要通过电子邮件地址获取结果(这应该可以防止贡献者姓名配置更改,并且会更准确):

git log --all --format='%aE' | sort -u

如果任何存储库都需要此功能,则可以编写一个简单的脚本,该脚本将采用存储库路径,克隆存储库,运行命令,然后删除下载的存储库。

与此同时,您可以联系GitHub,希望他们提高扩展/修复API的优先级。


答案 2

推荐