메뉴 건너뛰기

프로그래밍


R에서 페이스북 페이지의 포스트를 크롤링 하는 예제입니다.

이런 저렁 방법을 많이 찾아보고 시도 하였으나 본인 것이 아닌 타인의 타임라인에 있는 포스트들을 크롤링 하는 (공개된) 방법은 없더군요.

단, 개인 타임라인이 아닌 공개 "페이지"는 가능합니다. 


#필요 패키지
install.packages("Rfacebook")
library(Rfacebook)

#페이스북 앱id 정보와 secret 값 입
fbAuth = fbOAuth(app_id = "facebook_app_id", 
                 app_secret = "facebook_app_secret",
                 extended_permissions = FALSE)

start_date = '2016/12/01'
end_date = '2017/01/30'
scrape_days=seq(from = as.Date(start_date), to = as.Date(end_date), by = 'days')

#공인 페이지s
stars <- c("iu.loen", "OfficialLeeMinho", "barackobama")
posts <- c()

#공인 페이지로부터 페이지 정보 얻기
for (i in 1:length(stars)) {
  for(scrape_day in scrape_days) {
    tryCatch(
      {
        daypost=getPage(page = stars[i],
                        token = fbAuth,
                        since = as.Date(scrape_day, origin = "1970-01-01"),
                        until = as.Date(scrape_day, origin = "1970-01-01") + 1)
        
        posts = rbind(posts, daypost)
      },
      
      error = function(e){}
    )
  }
}

View(posts)




번호 제목 글쓴이 날짜 조회 수
공지 [TIP] PYTHON 에서 "UnicodeDecodeError: 'cp949' codec can't decode byte 0xe2 in position 6987: illegal multibyte sequence" 오류 날때... [48] 파이팅건맨 2016.02.20 105224
» [TIP] R에서 페이스북 페이지 정보 크롤링 하기 [6] 파이팅건맨 2017.02.11 15143
공지 [TIP] TensorFlow를 윈도우에서 사용하기 (A way to use TensorFlow on Windows) [3] 파이팅건맨 2016.04.16 14588
105 [LINK]Linux등의 환경에서 동적,정적 라이브러리 사용관련 파이팅건맨 2006.09.18 773
104 [펌] 클래스 맴버함수를 콜백함수로 사용하기 파이팅건맨 2006.08.25 2474
103 [펌]키입력을 바로 처리하는 linux용 코드 파이팅건맨 2006.08.23 325
102 [펌] ARM GCC Inline Assembler Cookbook 파이팅건맨 2006.08.18 3444
101 [펌]혼합 언어 프로그래밍과 외부 연결(linkage) 파이팅건맨 2006.08.14 943
100 [TIP] 소켓을 이용하여 HTTP프로토콜 사용하는 C 코드 예제 파이팅건맨 2006.05.25 1402
99 [TIP] 작업관리자의 응용프로그램탭에 나타나는 윈도우 이름 감추기 파이팅건맨 2005.12.18 1088
98 [TIP] 각종 API 후킹 혹은 어플리케이션 후킹 방법 모음 파이팅건맨 2005.07.30 532
97 [참고] PE operations on non PE file. error- 파이팅건맨 2005.07.13 232
96 [TIP] CGI 파싱 C소스(CGI POST Method Example: C Code ) 파이팅건맨 2005.06.09 1090
95 [TIP] WMI이용 무선랜카드 신호강도 얻기 파이팅건맨 2005.05.23 325
94 [TIP] WMI를 이용한 하드웨어 정보 얻기 파이팅건맨 2005.05.23 311
93 [TIP] WEB 페이지 스타일의 어플리케이션 만들기 파이팅건맨 2005.05.02 900
92 [TIP] CMOS 패스워드 초기화 코드 파이팅건맨 2005.05.02 768
91 [TIP] Mail Relay Check 펄 스크립트 파이팅건맨 2005.05.01 303
90 [TIP]레지스트리를 참조하여 열린 시리얼포트 찾기 파이팅건맨 2005.03.03 809
89 [TIP]비트맵 잘라내기의 원리와 API... 파이팅건맨 2005.03.03 1423
88 [TIP] XP 스타일의 버튼 만들기- 파이팅건맨 2004.05.12 238
87 인터넷 가능한지 알아보기 파이팅건맨 2004.05.12 229
86 [LINK] VC++7 to VC++6 project converter 파이팅건맨 2004.04.28 572
위로