메뉴 건너뛰기

?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄

Java 라이브러리 중에 JSOUP 라고 심플하면서도 왠지 간지나는 HTML 문서를 다루는 라이브러리가 있다.


요 라이브러리를 이용해 HTML 문서에서 각종 경로를 추출해서 요 경로를 절대 경로로 바꿔보자.


먼저 테스트할 html 문서

<html>
<head>
    <title>테스트다!!</title>
 
    <script type="text/javascript" src="/resource/js/jquery-1.7.1.min.js"></script>
 
    <link type="text/css" href="/resource/css/admin/general.css" rel="stylesheet" />
</head>
 
<body>
<span id="navi">
    <img src="http://www.naver.com/resource/image/stitle_standarda.gif" alt="" />
</span>
 
테스트다!!
</body>
</html>


테스트소스


import java.io.IOException;
import java.net.URL;
 
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
 
 
public class Test  {
    public static void main(final String[] args) throws IOException{
        Document doc = Jsoup.parse(
                new URL("http://127.0.0.1:8080/index.html").openConnection().getInputStream(), 
                "UTF-8", 
                "http://127.0.0.1:8080/");
         
        // src attribute 가 있는 엘리먼트들을 선택
        Elements elems = doc.select("[src]");
        for( Element elem : elems ){
            if( !elem.attr("src").equals(elem.attr("abs:src")) ){
                elem.attr("src", elem.attr("abs:src"));
            }
        }
         
        // href attribute 가 있는 엘리먼트들을 선택 
        elems = doc.select("[href]");
        for( Element elem : elems ){
            if( !elem.attr("href").equals(elem.attr("abs:href")) ){
                elem.attr("href", elem.attr("abs:href"));
            }
        }
         
        System.out.println(doc.toString());
    }
}

변환된 html 문서

<html>

<head>

    <title>테스트다!!</title>

    <script type="text/javascript" src="http://127.0.0.1:8080/resource/js/jquery-1.7.1.min.js"></script>

    <link type="text/css" href="http://127.0.0.1:8080/resource/css/admin/general.css" rel="stylesheet" />

</head>

<body>

    <span id="navi"> <img src="http://www.naver.com/resource/image/stitle_standarda.gif" alt="" /></span> 

    테스트다!!

</body>

</html>

JSOUP 사이트 : http://jsoup.org/


Maven Dependency


<dependency>

    <groupId>org.jsoup</groupId>

    <artifactId>jsoup</artifactId>

    <version>1.6.3</version>

</dependency>



List of Articles
번호 제목 날짜 조회 수
151 A java Runtime Environment(JRE) or Java Development Kit(JDK) must be ~~~~ 하면서 이클립스가 실행안될때. file 2019.03.05 788
150 Apache Commons HttpClient 3.x 로 Http 서버에 파일 전송하기 file 2019.01.08 1136
149 BigDecimal타입의 사칙연산 2016.12.22 3713
148 Database Connections 생성하기 (Mysql) file 2016.08.29 3365
147 Database Connections 생성하기 (오라클) file 2016.08.29 4072
146 eclipse 콘솔(로그)에 디버그(Debug) 모드에서 실행된 쿼리문을 보여주자. - 전자정부프레임워크 오라클 file 2016.08.29 4172
145 eclipse 콘솔(로그)에 디버그(Debug) 모드에서 실행된 쿼리문을 보여주자. - 전자정부프레임워크 오라클 file 2016.08.29 5997
144 Eclipse에서 import문 자동으로 작성하는 기능 file 2016.09.19 4811
143 enum 2016.09.13 3404
142 File 클래스 file 2016.09.13 3603
141 for-each문 file 2016.09.13 3120
140 GET 파라메타 쿼리문자열 컨트롤 : getQueryString 2016.12.09 4705
139 Gmail 메일 서버를 이용해서 메일 보내기 file 2020.06.29 256
138 HashMap 사용하기 file 2021.03.31 134
137 iBATIS 동적으로 맵핑하기 2016.12.09 3948
136 Jadclipse 플러그인 설치 file 2016.09.19 3512
135 JAR 파일 2016.09.19 3713
» Java : JSOUP 를 이용, html에서 소스, 링크경로 추출후 절대 경로로 바꾸기 2019.01.08 1166
133 JAVA CentOS JDK 설치 및 환경변수 설정 file 2018.07.09 1821
132 JAVA HashMap의 Key값 출력하기 2018.07.09 1069
Board Pagination Prev 1 2 3 4 5 6 7 8 Next
/ 8

하단 정보를 입력할 수 있습니다

© k2s0o1d4e0s2i1g5n. All Rights Reserved