通过 Java 中的 Google 自定义搜索 API V1 获取 10 多个结果

2022-09-02 20:55:47

我正在使用Java中的Google Custom Search API来获取Google响应查询的结果。我在其他帖子的帮助下编写了此代码,代码如下:

    url = new URL("https://www.googleapis.com/customsearch/v1?key="+key+ "&cx="+ cx +"&q="+    searchText+"&alt=json"+"&start="+0+"&num="+30);
    HttpURLConnection conn2 = (HttpURLConnection) url.openConnection();
    System.out.println("Connection opened!");
    conn2.setRequestMethod("GET");
    conn2.setRequestProperty("Accept", "application/json");
    BufferedReader br = new BufferedReader(new InputStreamReader(
    (conn2.getInputStream())));

问题是,每当我使用上面没有num和启动参数的代码时,它都能正确执行,但只给出前10个结果。所以我使用了num和start参数。但它们正在制造问题。在这里,我无法理解在URL中放置numstart参数的位置。它总是给出HTTP 400,即错误请求。我已经阅读了文档页面,也没有给出关于在Url中放置这两个参数的明确说明。

因此,如果有人帮助我解决这个问题,我将不胜感激。谢谢。


答案 1

你不能那样做。num 最多只能是 10。看

https://developers.google.com/custom-search/json-api/v1/reference/cse/list#num

num - 无符号整数
要返回的搜索结果数。有效值是介于 1 和 10 之间的整数(包括 1 和 10)。

为了显示更多结果,Google 建议进行多次调用,并根据需要递增 start 参数:

https://developers.google.com/custom-search/json-api/v1/reference/cse/list#start

开始 - 无符号整数要返回的第一个结果的索引。有效值是从 1(默认值)开始的整数,第二个结果是 2,依此类推。例如,&start=11 给出了第二页结果,默认的“num”值为每页 10 个结果。注意:使用 JSON API 的任何查询返回的结果都不会超过 100 个,即使匹配查询的文档超过 100 个,因此将 (start + num) 设置为 100 以上将产生错误。请注意,num 的最大值为 10。


答案 2

首先,Google说:“本节总结了可以与JSON / Atom Custom Search API一起使用的查询参数。所有参数值都需要进行 URL 编码。https://developers.google.com/custom-search/v1/using_rest#query-params这意味着“?”后面的所有内容都应该使用php url编码器的等效项进行编码,该编码器为urlencoding设定了标准。问题是Java的类URLEncoder不太对,你必须做几个替换All的。您需要对输入执行以下操作:

String queryArguments = "key="+key+ "&cx="+ cx +"&q="+    searchText+"&alt=json"+"&start="+"0"+"&num="+"30";

请注意数字两边是如何用引号括起来的。如果从变量中获取这些内容,请使用以下命令:

String thenum = Integer.toString(theinteger);

然后进行正确的编码

String addition = URLEncoder.encode(queryArguments, "UTF-8")
.replaceAll("\\%28", "(") 
.replaceAll("\\%29", ")") 
.replaceAll("\\+", "%20") 
.replaceAll("\\%27", "'") 
.replaceAll("\\%21", "!") 
.replaceAll("\\%7E", "~");

然后将其添加到原始的未编码网址中:

String url = "https://www.googleapis.com/customsearch/v1?"
String total = url + addition;

总之,您的代码将如下所示:

String query = URLEncoder.encode("key="+key+ "&cx="+ cx +"&q="+    searchText+"&alt=json"+"&start="+"0"+"&num="+"30"), "UTF-8").replaceAll("\\%28", "(") 
.replaceAll("\\%29", ")") 
.replaceAll("\\+", "%20") 
.replaceAll("\\%27", "'") 
.replaceAll("\\%21", "!") 
.replaceAll("\\%7E", "~");
URL url = new URL("https://www.googleapis.com/customsearch/v1?" + query);
HttpURLConnection conn2 = (HttpURLConnection) url.openConnection();
System.out.println("Connection opened!");
conn2.setRequestMethod("GET");
conn2.setRequestProperty("Accept", "application/json");
BufferedReader br = new BufferedReader(new InputStreamReader(
(conn2.getInputStream())));

我希望这对你有用。我对旧的已弃用的图像api做了非常相似的事情,但概念是相同的,我查看了新的文档。:)

编辑:请确保您的 num 参数介于 0 和 10 之间(包括 0 和 10)。


推荐