메뉴 건너뛰기

?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄

Java 라이브러리 중에 JSOUP 라고 심플하면서도 왠지 간지나는 HTML 문서를 다루는 라이브러리가 있다.


요 라이브러리를 이용해 HTML 문서에서 각종 경로를 추출해서 요 경로를 절대 경로로 바꿔보자.


먼저 테스트할 html 문서

<html>
<head>
    <title>테스트다!!</title>
 
    <script type="text/javascript" src="/resource/js/jquery-1.7.1.min.js"></script>
 
    <link type="text/css" href="/resource/css/admin/general.css" rel="stylesheet" />
</head>
 
<body>
<span id="navi">
    <img src="http://www.naver.com/resource/image/stitle_standarda.gif" alt="" />
</span>
 
테스트다!!
</body>
</html>


테스트소스


import java.io.IOException;
import java.net.URL;
 
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
 
 
public class Test  {
    public static void main(final String[] args) throws IOException{
        Document doc = Jsoup.parse(
                new URL("http://127.0.0.1:8080/index.html").openConnection().getInputStream(), 
                "UTF-8", 
                "http://127.0.0.1:8080/");
         
        // src attribute 가 있는 엘리먼트들을 선택
        Elements elems = doc.select("[src]");
        for( Element elem : elems ){
            if( !elem.attr("src").equals(elem.attr("abs:src")) ){
                elem.attr("src", elem.attr("abs:src"));
            }
        }
         
        // href attribute 가 있는 엘리먼트들을 선택 
        elems = doc.select("[href]");
        for( Element elem : elems ){
            if( !elem.attr("href").equals(elem.attr("abs:href")) ){
                elem.attr("href", elem.attr("abs:href"));
            }
        }
         
        System.out.println(doc.toString());
    }
}

변환된 html 문서

<html>

<head>

    <title>테스트다!!</title>

    <script type="text/javascript" src="http://127.0.0.1:8080/resource/js/jquery-1.7.1.min.js"></script>

    <link type="text/css" href="http://127.0.0.1:8080/resource/css/admin/general.css" rel="stylesheet" />

</head>

<body>

    <span id="navi"> <img src="http://www.naver.com/resource/image/stitle_standarda.gif" alt="" /></span> 

    테스트다!!

</body>

</html>

JSOUP 사이트 : http://jsoup.org/


Maven Dependency


<dependency>

    <groupId>org.jsoup</groupId>

    <artifactId>jsoup</artifactId>

    <version>1.6.3</version>

</dependency>



List of Articles
번호 제목 날짜 조회 수
51 이클립에서 Javadoc 생성시 unmappable character for encoding MS949 에러가 발생할때 file 2019.03.05 730
50 익명클래스 2016.09.13 3143
49 인터페이스 2016.09.13 3089
48 인터페이스와 다형성 2016.09.13 3535
47 자바 - 공백 문자 제거하기 (trim, replaceAll) file 2021.03.31 173
46 자바 extends Thread, implements Runnable 차이 file 2023.02.15 77
45 자바 extends, implements 차이점 알아보기 file 2023.02.15 75
44 자바 int 값 자리수 구하기 file 2023.02.15 74
43 자바 JXL 엑셀파일을 읽어 배열리턴 : JAVA EXCEL ArrayList 2016.12.09 4389
42 자바 Statement PreparedStatement 차이 알아보기 file 2023.02.15 53
41 자바 String Class 문자열 처리 함수에 대한 정리 2021.03.31 106
40 자바 this, super 차이 알아보기 file 2023.02.15 72
39 자바 Thread dump file 2023.02.15 58
38 자바 XML 제어 라이브러리 XStream : JAVA 2016.12.09 4918
37 자바 객체화(인스턴스화) 알아보기 file 2023.02.15 69
36 자바 날짜 포맷 변환 방법 file 2018.06.21 1425
35 자바 다양한 형변환. 그리고 아스키 코드 String char int : JAVA 2016.12.09 4188
34 자바 대소문자 확인하는 방법 file 2023.02.15 130
33 자바 랜덤 함수(Java random) file 2019.03.05 766
32 자바 메소드(Method)란 무엇인가? file 2023.02.15 78
Board Pagination Prev 1 2 3 4 5 6 7 8 Next
/ 8

하단 정보를 입력할 수 있습니다

© k2s0o1d4e0s2i1g5n. All Rights Reserved