CI 묻고 답하기

제목 페이지의 이미지 중 최적화 된 이미지 가져오기.
글쓴이 Lectom 작성시각 2011/11/10 17:33:12
댓글 : 2 추천 : 0 스크랩 : 0 조회수 : 22602   RSS
하하... 오랜만 입니다..  그동안 정신 없었어요 ㅜ.ㅜ

다름이 아니라 URL을 받아 해당 문서의 그림을 읽어오고, 본문이랑 주요 컨텐츠를 파악해보는 작업을 하는데, (검색엔진 쪽에서도 가장 골머리를 앓는 분야중 하나라고 듣긴 했습니다... ㅠ.ㅠ) 

if (!$content = @file_get_contents($url))

    {    

        return false;

    }

preg_match_all("/<img[^>]*src=[\"']?([^>\"']+)[\"']?[^>]*>/i", $content, $img);

return $img[1];

대략 이런식으로 구현하긴 했는데요, 받아온 이미지 URL 중에, 뭐가 적합한지 모르겠어요 ㅠ.ㅠ 크기로 분리할까 했는데, 크기로 구분하기도 막막하고.... 뭔가 좋은 방법이 없을까요...?

이런게 있긴 하던데 말이죠... -0-
http://dev.paran.com/2011/07/22/goose-open-source-web-documents-contents-extractor/  

 다음글 jquey질문좀 드리겟습니다. (1)
 이전글 pagination MVC로 예제좀 하나 올려주세염 (1)

댓글

변종원(웅파) / 2011/11/10 20:53:39 / 추천 0
이미지중 뭐가 좋을지는 결국 개발자가 선택해야할 몫입니다.

예전에 본 비슷한 툴중에 야후(미국)것이 있습니다. 해당 페이지에서 선택한 특정영역만 스크래핑하도록
한 api였는데 이름은 기억이 안나네요.

특정주소에서 사용자가 선택한 부분만 가져오기 뭐 이런거였습니다.

한대승(불의회상) / 2011/11/11 00:20:43 / 추천 0
최적화된 이미지라는게 참 애매하죠... ^^
웅파님 의견대로 이미지 관련 URL만 가져와서 사람이 직접 보고 선택하게 하는게 나을것 같습니다.