회원가입아이디/비번찾기
홈으로

php로 작성한 간단 RSS2.0 리더
12년 전
소스는 PHP5로 작성했고, 내장된 SAX 파서를 이용했습니다.
SAX파서는 이벤트 기반 파서라서 구현도 간단하고, 속도도 빠릅니다.

RSS는 현재 가장 널리 쓰이는 RSS 2.0을 대상으로 했습니다.
이글루스와 테터도 RSS 2.0을 지원하고 있습니다.

완성된 소스 자체는 간단한데, 제가 PHP를 처음 다뤄봐서 시행착오를 많이 거쳤습니다. 사실 지금도 PHP의 문법과 라이브러리를 완전히 숙지한 상태가 아니라서, 소스 자체도 그리 깔끔하다고는 말 못하겠습니다.

여기 공개된 소스는 제가 작업한 것을 적당히 간추린 것입니다.

rss_fetch.php

<?php

include_once 'lib.php';

  //가져올 RSS 주소를 지정하면됩니다.
$urls = array('http://sizuha.egloos.com/index.xml', 'http://kori2sal.innori.com/rss');

foreach ($urls as $url):
     $handle = fopen($url, 'r');

     if ($handle):
          $document = '';

          while (!feof($handle))
               $document .= fgets($handle, 4096);

          fclose($handle);

           //파서 생성
           $rss = new RSSParser;

           //파싱
          $rss->setRSS($document);
          rssParse($rss);

          $rss = NULL;
     endif;
endforeach;

?>



lib.php

<?php

function rssParse($rss_obj)
{  
      //내장 XML 파서 생성
     $xml_parser = xml_parser_create('UTF-8');
  
     xml_set_object($xml_parser, $rss_obj);  
     xml_parser_set_option($xml_parser, XML_OPTION_CASE_FOLDING, FALSE);

      //XML 파서에 이벤트 핸들러를 할당
     xml_set_element_handler($xml_parser, "startElement", "endElement");
     xml_set_character_data_handler($xml_parser, "characterData");

      //XML 파싱
     xml_parse($xml_parser, $rss_obj->getRSS());
     xml_parser_free($xml_parser);
}


class RSSParser
{
     private $rss_doc;

     private $current_element;
     private $in_item = FALSE;
     private $in_description = FALSE;
     private $title;
     private $date;
     private $link;
     private $category;
     private $content;


     function setRSS($rss_text)
     {
          $this->rss_doc = $rss_text;
     }

     function getRSS()
     {
          return $this->rss_doc;
     }

     //태그가 시작하는 부분에서 처리할 내용  
     function startElement($parser, $element, $attrs)
     {
          if ($this->in_description) return;    

          $this->current_element = strtoupper($element);
  
          switch ($this->current_element):
               case 'ITEM' :
                    $this->in_item = TRUE;
                    break;

               case 'DESCRIPTION' :
                    if ($this->in_item) {
                         $this->in_description = TRUE;
                         $this->content = '';
                    }
                    break;
    
               default:
                    break;    
          endswitch;
     }

     function endElement($parser, $element)
     {
          $el = strtoupper($element);

          if ($this->in_description and 'DESCRIPTION' != $el) return;

          switch (strtoupper($el)):
               case 'ITEM' :
                    $this->in_item = FALSE;
                    $this->printItem();        // 저장된 포스트를 출력하거나 DB로 자장하면 됨.
                     break;

               case 'DESCRIPTION' :
                    if ($this->in_item) {
                         $this->in_description = FALSE;
                    }
                    break;

               default:
                    break;    
          endswitch;

          $this->current_element = '';
     }

     function characterData($parser, $data)
     {  
          if ('' == trim($data)) return;

          if ($this->in_item):
  
           switch ($this->current_element):
                case 'TITLE' :
                     $this->title = $data;
                     break;

                case 'DESCRIPTION' :
                     $this->content .= $data; //반드시 .= 연산자를 써야함!
                      break;

                case 'CATEGORY' :
                     $this->category = $data;    
                     break;

                case 'PUBDATE' :
                     $this->date = $data;
                     break;

                case 'LINK' :
                     $this->link = $data;
                     break;
           endswitch;  
    
          endif;
     }      

      //여기서는 바로 출력을 하지만, DB에 저장하는 방식으로 구현할 수도 있습니다.
      private function printItem()
     {
          echo "<P><STRONG>";
          echo $this->title;
          echo "</STRONG>";
  
          echo "  (";
          echo $this->date.")</P>";
  
          echo $this->content;
          echo "<BR>";
          echo $this->category." | ";
          echo $this->link;
  
          echo "<br><br>";
     }
  
}//end of class

?>



RSS 리더를 만들 때의 주의사항

1. RSS는 UTF-8로 인코딩되어 있습니다. 따라서 RSS의 데이터를 변환없이 그냥 웹페이지에 뿌리려면, 웹페이지 역시 UTF-8로 인코딩되어 있어야 합니다. 저는 모든 작업 파일들(PHP, HTML, TXT)을 전부 UTF-8로 통일했습니다.

2. RSS의 PubDate 태그는 게시물의 날짜를 담고 있는 테그이지만, 문제는 이것이 GMT 시간입니다. 웹에 게시할때는 현지(한국) 시간으로 변환해야 할 것입니다.

※ 추가 사항

제가 참고한 것은 이글루스와 테터의 RSS입니다.
사실 RSS의 인코딩 방식과 테그 부분에서는 포탈마다 차이가 있습니다.
추천추천 : 601 추천 목록
번호 제목
2,885
input 입력 필드 앞뒤 공백 실시간 제거
2,884
Placeholder 포커스시 감추기
2,883
MySQL 중복된 데이터를 삭제
2,882
MySQL 중복 데이터 확인
2,881
sessionStorage.getItem 와 sessionStorage.setItem
2,880
제이쿼리 랜덤으로 배경색 변경
2,879
preg match에 관한 정규식
2,878
Stream an audio file with MediaPlayer 오디오 파일 스트리밍 하기
2,877
Audio Streaming PHP Code
2,876
PHP $ SERVER 환경 변수 정리
2,875
Vimeo (비메오) API 를 사용하여 플레이어 컨트롤하기
2,874
iframe 사용시 하단에 발생하는 공백 제거방법
2,873
아이프레임(iframe) 전체화면 가능하게 하기
2,872
부트스트랩(bootstrapk)에서 사용하는 class명 정리
2,871
부트스트랩 CSS
2,870
크롬에서 마진 조절
2,869
PHP 현재 페이지의 도메인명이나 url등의 정보 알아오기
2,868
PHP preg match all()
2,867
PHP 로 웹페이지 긁어오기 모든 방법 총정리!
2,866
[PHP] 원격지 파일 주소 노출 안하고 curl로 다운로드 받기
2,865
PHP 함수 정리
2,864
아이프레임(iframe) 비율 유지하면서 크기 조절하는 방법
2,863
PHP 배열에서 무작위로 하나 뽑아주는 array rand() 함수
2,862
PHP 정규식 정리
2,861
PHP 정규식을 활용한 태그 및 특정 문자열 제거 및 추출 방법
2,860
php 크롤링 또는 파싱 함수, 정규식 모음
2,859
제이쿼리 기본 명령어
2,858
웹페이지 가로 모드세로 모드 인식하기
2,857
모바일 웹 화면 강제 회전(가로모드 고정)
2,856
[HTML5]에서 frameset 대체 방법과 iframe 속성
목록
뮤직트로트 부산광역시 부산진구 가야동 ㅣ 개인정보취급방침
Copyright ⓒ musictrot All rights reserved.