홈으로 | 무료회원가입 | 아이디/비번찾기
추천음악방송
태그 제거 함수 strip tags2 & 링크 추출 함수 extract link
11년 전
로컬 검색 엔진을 만들기 위해 필요한 함수를 만들어 봤다.
컨테츠의 텍스트 추출, 링크 추출 함수

텍스트 추출 함수

function strip_tags2(){
    $search = array ("']*?>.*?'si",    // 자바 스크립트 제거
                     "'<[\/\!]*?[^<>]*?>'si",                    // HTML 태그 제거
                     "'<\!\-\-(.*)?\-\->'si",                        //주석제거
                     "'([\r\n])[\s]+'",                                
                     "'&(quot|#34);'i",                                // HTML 엔티티 치환
                     "'&(amp|#38);'i",
                     "'&(lt|#60);'i",
                     "'&(gt|#62);'i",
                     "'&(nbsp|#160);'i",
                     "'&(iexcl|#161);'i",
                     "'&(cent|#162);'i",
                     "'&(pound|#163);'i",
                     "'&(copy|#169);'i",
                     "'&#(\d+);'e");                    // php로 실행

    $replace = array ("",
                      "",
                      "",
                      "\\1",
                      "\"",
                      "&",
                      "<",
                      ">",
                      " ",
                      chr(161),
                      chr(162),
                      chr(163),
                      chr(169),
                      "chr(\\1)");

    preg_replace($search,$replace,$data);
}//end function



링크 추출 함수
function extract_link($file){

        $data = file_get_contents($file);

        preg_match_all("/href=['\"]?([\?\&\=\/\.\_\:a-z0-9]+)['\"\s]?/i",$data,$out,PREG_SET_ORDER);//파라미터 사용할 경우
        foreach($out as $key=>$val){
                $link = $val[2];
                if( ereg("\.gif|\.jpg|\.png|\.hwp|\.xls|\.swf|\.css|javascript:|mailto:",$link) ) continue;
                if( ereg("http://",$link ) ) if( !ereg($HOST,$link) ) continue;

                if( ereg("^..\/",$link) ){
                        $_link = $ROOT_URL."/".$link;
                } elseif ( ereg("^\/",$link) ) {
                        $_link = $ROOT_URL.$link;
                } else {
                        $_link = substr($lnk,0,strrpos($lnk,"/"))."/".$link;
                }
                        $i++;

                        if( !chkLink($_link) ) continue;
                        $LINK[$i] = $_link;


                        unset($text);
                        extract_link($_link);//재귀호출
                        flush();
        }//end of foreach
}
추천추천 : 528 추천 목록
번호 제목
3,035
 아이프레임(iframe) 비율 유지하면서 크기 조절하는 방법
3,034
 PHP 배열에서 무작위로 하나 뽑아주는 array rand() 함수
3,033
 PHP 정규식 정리
3,032
 PHP 정규식을 활용한 태그 및 특정 문자열 제거 및 추출 방법
3,031
 php 크롤링 또는 파싱 함수, 정규식 모음
3,030
 제이쿼리 기본 명령어
3,029
 웹페이지 가로 모드세로 모드 인식하기
3,028
 모바일 웹 화면 강제 회전(가로모드 고정)
3,027
 [HTML5]에서 frameset 대체 방법과 iframe 속성
3,026
 HTML <Audio> 사용법
3,025
 윈도우10 시스템파일 손상 (초간단 오류 복구방법!!)
3,024
 PHP 파일 존재 여부 파악하기(로컬 파일 존재 및 원격지 파일 존재)
3,023
 [CSS] 박스 세로 가운데 중앙 정렬 6가지
3,022
 CSS Layout 수평 & 수직 정렬
3,021
 여러 도메인들 간 쿠키 공유하기
3,020
 태그 사이에 있는 텍스트를 추출
3,019
 [JQuery] textbox focus on off일때 숫자 콤마 보여주기
3,018
 쿠키 생성,가져오기,삭제
3,017
 사용자 함수 모음
3,016
 마우스,키보드 제한 ( 오른쪽클릭,드래그,영역선택등..)
3,015
 [HTML5] <video> - DOM으로 제어하기
3,014
 HTML5 video 태그에서 영상 좌우반전
3,013
 PHP - 특정 태그 및 문자열 추출, 제거
3,012
 [PHP] define과 defined의 차이
3,011
 우클릭 완벽차단 스크립트
목록
뮤직트로트 부산광역시 부산진구 가야동 ㅣ 개인정보취급방침
Copyright (C) musictrot All rights reserved.