Data Mining R

R에서 CSS 선택자로 간편하게 웹 스크래핑(웹 크롤링)을 하는 방법

웹 스크래핑(Web Scraping) 또는 웹 크롤링(Web Crawling)은 웹 페이지로부터 원하는 정보를 추출하는 기법입니다. 어떤 서비스에서 API가 별도로 제공되고 있지 않지만 웹 페이지로는 정보가 제공되고 있을 때, 웹 스크래핑 기법을 이용하면 원하는 정보를 획득할 수 있습니다.

웹 스크래핑의 원리에 대해서는 이전 글인 웹 스크래핑(웹 크롤링)의 원리에서 다루었습니다. 이번 글에서는 Ruby에서 패키지 2가지를 조합하여 손쉽게 구현한 웹 스크래핑 함수 예제코드를 소개합니다.

(more…)

Continue reading

Backends Data Mining PHP R

PHP 소스코드에서 R 스크립트 실행하기

데이터와 통계분석에 활용되는 R을 웹 언어에서 실행한다면, 강력한 시너지 효과를 기대할 수 있을 것입니다. 그러나 많은 개발자들의 도전에도 불구하고 이것은 쉽지 만은 않은 과제였는데, 그 이유는 바로 R을 Input File 없이 커맨드라인에서 실행할 수 있는 방법이 녹록치 않았기 때문입니다.

이번 포스팅에서 소개하는 PHP 클래스는, 인자로 받은 R 스크립트를 임시파일로 만들어 쉘 커맨드로 R을 실행한 결과를 반환합니다. 이를 통해서 PHP에서 R 스크립트를 문자열로 만들어 그대로 실행할 수 있습니다. 본 클래스는 리눅스 OS에서 작동하는 것을 전제로 합니다.

(more…)

Continue reading

Data Mining R

10분 만에 살펴보는 R 기초문법

R은 통계적인 계산과 데이터 분석에 특화되어 있는 프로그래밍 언어입니다. 빅데이터의 대두와 함께 주목받아 그 이름이 널리 알려지게 되었지요. 새로운 언어를 공부하는 가장 좋은 방법은 책 한 권을 정독하거나, 혹은 그 언어의 공식 매뉴얼을 앞에서부터 따라가며 익히는 것입니다. 다만 이처럼 정석대로 단계 단계를 짚어가며 익힐 수 있는 여유를 가지지 못한 분들도 계실 것입니다.

이번 포스팅은 기존에 1가지 이상 익숙한 프로그래밍 언어를 가진 분들이 R의 가장 기초적인 부분을 10분 전후의 짧은 시간에 익숙해질 수 있도록 튜토리얼 형태로 쓰여졌습니다. 짧은 시간에 빠르게 R에 익숙해지기를 원하시는 분들께는 이번 포스팅이 큰 도움이 될 것입니다. 충분한 시간을 가지고 있으신 분은 이 포스팅을 살펴본 후에 R의 공식문서인 An Introduction to R을 읽어보시기를 권해드립니다.

(more…)

Continue reading