메뉴 건너뛰기

프로그래밍


R에서 페이스북 페이지의 포스트를 크롤링 하는 예제입니다.

이런 저렁 방법을 많이 찾아보고 시도 하였으나 본인 것이 아닌 타인의 타임라인에 있는 포스트들을 크롤링 하는 (공개된) 방법은 없더군요.

단, 개인 타임라인이 아닌 공개 "페이지"는 가능합니다. 


#필요 패키지
install.packages("Rfacebook")
library(Rfacebook)

#페이스북 앱id 정보와 secret 값 입
fbAuth = fbOAuth(app_id = "facebook_app_id", 
                 app_secret = "facebook_app_secret",
                 extended_permissions = FALSE)

start_date = '2016/12/01'
end_date = '2017/01/30'
scrape_days=seq(from = as.Date(start_date), to = as.Date(end_date), by = 'days')

#공인 페이지s
stars <- c("iu.loen", "OfficialLeeMinho", "barackobama")
posts <- c()

#공인 페이지로부터 페이지 정보 얻기
for (i in 1:length(stars)) {
  for(scrape_day in scrape_days) {
    tryCatch(
      {
        daypost=getPage(page = stars[i],
                        token = fbAuth,
                        since = as.Date(scrape_day, origin = "1970-01-01"),
                        until = as.Date(scrape_day, origin = "1970-01-01") + 1)
        
        posts = rbind(posts, daypost)
      },
      
      error = function(e){}
    )
  }
}

View(posts)




번호 제목 글쓴이 날짜 조회 수
공지 [TIP] PYTHON 에서 "UnicodeDecodeError: 'cp949' codec can't decode byte 0xe2 in position 6987: illegal multibyte sequence" 오류 날때... [48] 파이팅건맨 2016.02.20 105338
» [TIP] R에서 페이스북 페이지 정보 크롤링 하기 [6] 파이팅건맨 2017.02.11 15149
공지 [TIP] TensorFlow를 윈도우에서 사용하기 (A way to use TensorFlow on Windows) [3] 파이팅건맨 2016.04.16 14591
25 타이머 관련해서 질문 드립니다. [1] 진성봉 2005.10.20 297
24 클라이언트에서 서버에 접속시 버전체크후 다운받는루틴 [1] LEEHK 2005.10.12 276
23 시리얼 통신 DCB 셋팅 [1] 이상진 2005.10.05 461
22 nt베이스에서 컴포트 인터럽트제어 [1] 이상진 2005.09.29 263
21 다시 질문드립니다.. [1] 고진원 2005.08.25 202
20 PCI 시리얼통신카드 드라이버 관련 [1] 은성아바 2005.08.23 837
19 추가질의좀...VESA 확장 바이오스 함수로 화면 전화은 어떻게... [1] 정** 2005.06.08 423
18 VESA바이오스 함수로 그레픽 출력 어셈블 코드를 자세한 설명과 소스좀 부탁드림니다. [1] 정** 2005.06.05 331
17 질문]winCE Platformbuilder에관하여 [1] 박기용 2005.05.16 163
16 답변 감사합니다. 고진원 2005.04.15 128
15 데브피아에 올리신 자료에 대한 문의 [1] 고진원 2005.04.13 193
14 Devpia 질문 답변 부탁합니다. [1] 김진식 2004.10.07 244
13 VC++6.0환결설정 [6] 유동철 2004.02.16 721
12 VC++ 에서 DLL 만들때.. [1] 박성철 2003.11.28 238
11 UrlEscape 에러 [2] 이슬 2003.11.08 253
10 리소스에 exe파일을 합치는 것에 대해... [1] 이명규 2003.08.27 190
9 감사하구요 한가지만... [1] 정준호 2003.07.31 193
8 어디에 있는지... [1] 정준호 2003.07.30 137
7 HTML의 INPUT 테그값을 얻어오는 방법 [1] 홍성호 2003.07.20 396
6 MainFrm.cpp에서 ConnectDlg.cpp 함수쓰기 [1] 이락상 2003.07.03 185
위로