자바 정규식 html 태그를 제외한 문자열 출력

 

1. 정규 표현식을 이용하여 html 태그를 제거하는 방법

//HTML Tag가 포함된 문자열
String beforeString = ""
	+ "<html>"
	+ "<head>"
	+ "<script src=\"/script/main.js\"></script>"
	+ "<meta http-equiv=\"X-UA-Compatible\" content=\"IE=edge,chrome=1\"/>"
	+ "<meta charset=\"utf-8\"/>" 
	+ "<title>여기랑.. </title>"
	+ "</head>"
	+ "</body>"
	+ "<div id=\"id1\" style=\"display:block;width:100px;height:100px\" class=\"class\">여기만 출력되면 정상</div>"
	+ "</body>"
	+ "</html>";
//HTML Tag 제거
String afterString = beforeString.replaceAll("<([^>]+)>", "");
//HTML Tag 제거 후 출력
System.out.println(afterString);

위와 같이 html tag가 포함된 문자열이 있다

정규식을 이용하여 자바에서 html tag를 제외 후 문자열을 출력하였다

 

 

2. 결과 

콘솔이 정상이라고 한다 정상이다

 

 

자바스크립트 소스는 아래와 링크를 참고

 

Javascript 정규식 html tag 제거

Javascript 정규식 html tag 제거 1. 정규 표현식을 이용하여 html 태그를 제거하는 방법 //HTML Tag가 포함된 문자열 var beforeString = "" + "" + "" + "

niphyang.tistory.com