如何使用java从给定的URL中获取基本URL
我正在尝试使用java获取基本URL。我在代码中使用了jtidy解析器来获取标题。我使用jtidy正确获取了标题,但我没有从给定的URL获取基本URL。
我有一些URL作为输入:
String s1 = "http://staff.unak.is/andy/GameProgramming0910/new_page_2.htm";
String s2 = "http://www.complex.com/pop-culture/2011/04/10-hottest-women-in-fast-and-furious-movies";
从第一个字符串开始,我想获取作为基本URL,从第二个字符串中,我想作为基本URL。"http://staff.unak.is/andy/GameProgramming0910/"
"http://www.complex.com/"
我正在使用代码:
URL url = new URL(s1);
HttpURLConnection conn = (HttpURLConnection) url.openConnection();
InputStream in = conn.getInputStream();
Document doc = new Tidy().parseDOM(in, null);
String titleText = doc.getElementsByTagName("title").item(0).getFirstChild()
.getNodeValue();
我得到,但请让我知道如何从上面获得基本URL给定的URL?titletext