메뉴 건너뛰기

프로그래밍


R에서 페이스북 페이지의 포스트를 크롤링 하는 예제입니다.

이런 저렁 방법을 많이 찾아보고 시도 하였으나 본인 것이 아닌 타인의 타임라인에 있는 포스트들을 크롤링 하는 (공개된) 방법은 없더군요.

단, 개인 타임라인이 아닌 공개 "페이지"는 가능합니다. 


#필요 패키지
install.packages("Rfacebook")
library(Rfacebook)

#페이스북 앱id 정보와 secret 값 입
fbAuth = fbOAuth(app_id = "facebook_app_id", 
                 app_secret = "facebook_app_secret",
                 extended_permissions = FALSE)

start_date = '2016/12/01'
end_date = '2017/01/30'
scrape_days=seq(from = as.Date(start_date), to = as.Date(end_date), by = 'days')

#공인 페이지s
stars <- c("iu.loen", "OfficialLeeMinho", "barackobama")
posts <- c()

#공인 페이지로부터 페이지 정보 얻기
for (i in 1:length(stars)) {
  for(scrape_day in scrape_days) {
    tryCatch(
      {
        daypost=getPage(page = stars[i],
                        token = fbAuth,
                        since = as.Date(scrape_day, origin = "1970-01-01"),
                        until = as.Date(scrape_day, origin = "1970-01-01") + 1)
        
        posts = rbind(posts, daypost)
      },
      
      error = function(e){}
    )
  }
}

View(posts)




번호 제목 글쓴이 날짜 조회 수
공지 [TIP] PYTHON 에서 "UnicodeDecodeError: 'cp949' codec can't decode byte 0xe2 in position 6987: illegal multibyte sequence" 오류 날때... [48] 파이팅건맨 2016.02.20 105318
» [TIP] R에서 페이스북 페이지 정보 크롤링 하기 [6] 파이팅건맨 2017.02.11 15145
공지 [TIP] TensorFlow를 윈도우에서 사용하기 (A way to use TensorFlow on Windows) [3] 파이팅건맨 2016.04.16 14591
45 가상키보드 후킹 포커스 문제... [1] 문현민 2010.12.10 1167
44 소스코드에 대한 추가질문입니다^^ [1] 통신관련대학생 2009.05.26 168
43 마무리 질문일듯합니다^^^^^^ [1] 통신관련대학생 2009.05.14 974
42 밑에 소스에 대한 추가질문입니다 ^^ [1] 통신관련대학생 2009.05.13 359
41 홈페이지 주인님 소스에 대한 질문입니다 [1] 통신관련대학생 2009.05.12 512
40 Gunshadow가 관련된 질문 입니다. [1] 오성근 2007.12.17 149
39 Gunshadow.sys 파일의 바이러스 진단 여부에 대한 문의입니다. [5] 어베스트! 고객지원팀 2007.12.11 140
38 Gunshadow.sys,dll파일 삭제에 관해서, [1] 메이트 2007.12.01 548
37 레지스트리후킹 [1] 임비스 2006.11.17 369
36 그래도 신호강도를 못 받고 있습니다.ㅠ0ㅠ [1] 정성욱 2006.06.27 232
35 무선랜카드에서 연결속도 및 신호강도 받아오는 방법이 궁금합니다. [1] 정성욱 2006.06.26 614
34 CRC - 16 소스 수정할려고 하는데 어떻게 해야할지.. 질문드립니다. [1] 전철민 2006.06.23 724
33 Extern을 이용하여 모듈화 할때 문제점 질문드립니다!!! [1] 전철민 2006.06.23 296
32 visual C를 이용해서 미디어 플레이어 짜는법좀 [1] 김지만 2006.04.27 278
31 시리얼통신관련 질문..(응답속도에 관해..) [1] 고진원 2006.04.03 644
30 crc체크기??crc체크? [1] 초보 2006.01.08 766
29 sys파일에 관한 질문 입니다 [3] 학생 2005.12.30 288
28 온라인게임에서 CRC check 차단하는법, [1] CRC check 2005.12.18 421
27 CRC 체크 소스 관련 질문 드립니다. [1] 2005.12.11 642
26 485 컨버터를 이용한 통신 RTS제어 [3] 이상진 2005.11.29 395
위로