개발 Q&A

제목 크롤링중 한글깨짐에 대해 궁금한것이 있습니다. ( 수정 2013.10.29 17:57:00 )
글쓴이 dataguru 작성시각 2013/10/29 17:26:48
댓글 : 4 추천 : 0 스크랩 : 0 조회수 : 21776   RSS
 지금 현제 PHP로 크롤러를 개발하고 있습니다.
그런데 테스트중 2개의 사이트를 테스트 해봣는데요 한글이 깨저서 나옴니다. 아주 간단한 문제 이긴하지만
해결이 안됩니다. 

아래 이미지 첨부합니다.

크롤러 테스트 URL : http://dataguru.kr/

테스트 URL은 아래와 같습니다.
1. http://www.cikorea.net
2. http://hogu.kr/

1 번은 코드이그나이터 포럼 홈페이지 입니다.
2 번은 호구(hogu.kr) 페이지입니다.
   ( 페이지가 호구라는게 아니라 페이지 이름이 호구 입니다 )

hogu.kr 은 Codeigniter + Apache + MySQL, PHP 로 만들어 졋습니다.
MySQL은 utf-8 입니다.

그런데 아래의 사진중 오른쪽을 보시면 한글이 깨져서 나옴니다.
그런데 중요한건 데이터베이스 에서 가져오는 부분만 깨져서 나온다는 것입니다. 문제점이 뭘까요??

데이터베이스 테이블 일부분입니다.
CREATE TABLE IF NOT EXISTS `comment` (
  `comment_id` int(11) NOT NULL,
  `post_id` int(11) NOT NULL,
  `parent_id` int(11) NOT NULL DEFAULT '0' COMMENT '부모댓글 식별자\n0: 댓글\n0 < parent_id: 대댓글',
  `group_id` int(11) NOT NULL DEFAULT '0' COMMENT '대댓글 그룹',
  `content` text NOT NULL,
  `user_id` int(11) NOT NULL DEFAULT '0' COMMENT '0: 로그인안한 사용자가 작성\n0 < user_id : 로그인한 회원이작성',
  `password` varchar(255) NOT NULL,
  `ip_address` varchar(16) NOT NULL,
  `set_date` datetime NOT NULL,
  `up_date` datetime NOT NULL,
  PRIMARY KEY (`comment_id`),
  KEY `fk_comment_post1_idx` (`post_id`),
  KEY `set_date_idx` (`set_date`),
  KEY `user_id_idx` (`user_id`),
  KEY `group` (`group_id`),
  KEY `group_2` (`group_id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;
 



database 설정부분입니다.


MySQL 정보 부분입니다.


.php 인코딩 정보 입니다.





 다음글 브라우저 캐시삭제? (2)
 이전글 이미지 보이게 하기 (2)

댓글

변종원(웅파) / 2013/10/29 17:30:33 / 추천 0
데이터가 euc-kr 포맷일 수도 있고
해당 뷰 파일 캐릭터셋이 euc-kr일 수도 있습니다.

현재 정보만 가지고는 정확한  답을 얻기 힘듭니다.
dataguru / 2013/10/29 17:51:39 / 추천 0
 감사합니다 변종원님 다시 수정했습니다.
해당 뷰 파일 캐릭터셋이 euc-kr 이라는 건 .php 문서 인코딩이 euc-kr 이라는 건가요?
.php 문서는 utf-8 로되어 있습니다. 이유가 뭔질 모르겟네요...
변종원(웅파) / 2013/10/29 18:22:31 / 추천 0
db캐릭터셋 말고 그 안에 들어 있는 데이터의 캐릭터셋을 확인해보세요.
dataguru / 2013/10/29 19:39:42 / 추천 0

감사합니다. 변종원님 그부분에 대해 알아보겟습니다.
데이터 캐릭터셋문제 라면 이전에 입력되었던 데이터까지 전부 변경해야할텐데 변경하는 방법이 있나요??