본문 바로가기 메뉴 바로가기

루키의 보석함

프로필사진
  • 글쓰기
  • 관리
  • 루키주요글
  • 루키가 읽은 책
  • 태그
  • 방명록
  • RSS

루키의 보석함

검색하기 폼
  • 분류 전체보기 (666)
    • 사색 (293)
      • 독서 (152)
      • 칼럼 (9)
      • 세미나 (18)
      • 리뷰 (94)
      • 영어 (7)
    • Cloud&BigData (90)
      • 하둡(Hadoop) (22)
      • R (23)
      • BigData (18)
      • Machine Learing (20)
    • XML Developer (42)
      • SCORM (9)
      • XML기초 (8)
      • HTML5 (7)
      • 디자인 패턴 (12)
      • XSL (6)
    • 컴퓨터공학 (74)
      • 전산보안론 (7)
      • 소프트웨어공학 (5)
      • 디지털서비스 (18)
      • 디지털네트워크 (1)
      • 통계학 (9)
      • 프로젝트관리론 (34)
    • 프로그래밍 (151)
      • 아이폰 (15)
      • 안드로이드 (24)
      • 리눅스 (17)
      • MySQL (11)
      • Java (26)
      • Web (40)
      • 기타 (11)
    • 셀프 (0)
    • 정보시스템감리 (16)
      • 감리 및 사업계획 (16)
  • 방명록

wordcount (1)
하둡 스트리밍을 활용한 파이썬 word counting 예제~

하둡 스트리밍을 활용하면 맵리듀스 잡을 실행가능한 스크립트, 쉘 프로그래밍/파이썬/자바/R 등으로 처리할 수 있다. 하둡 스트리밍에 대해서는 Apache Hadoop Streaming을 참고하면 된다. 이번 강의에서는 기본 하둡 예제인 Word Count를 파이썬으로 구성한 후, 하둡 스트리밍으로 맵리듀스를 적용하는 예제를 살펴보기로 한다. 하둡 스트리밍 명령어는 다음과 같이 사용법을 확인할 수 있다. > hadoop jar /usr/lib/hadoop-mapreduce/hadoop-streaming.jar --help 1. 먼저 파이썬으로 맵 함수를 만들어 보자. WordCount에서 맵 함수는 파일의 각 라인별로 읽어서 공백으로 자른 다음, Key: 단어, Value: 1로 출력하면 된다. > ged..

Cloud&BigData/하둡(Hadoop) 2016. 1. 15. 07:07
이전 1 다음
이전 다음
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
  • 수식입력_latex
  • W3Schools Online Web Tutorials
  • 영어 학습 사이트
TAG
  • 책
  • fingra.ph
  • 디자인
  • r
  • ms
  • 아이폰
  • SCORM
  • 구글
  • 맥
  • 도서
  • XML
  • java
  • HTML
  • 웹
  • 클라우드
  • 자바스크립트
  • 분석
  • 통계
  • 세미나
  • 애플
  • 하둡
  • 프로젝트
  • 모바일
  • Hadoop
  • mysql
  • 빅데이터
  • 안드로이드
  • 자바
  • 마케팅
  • Google
more
«   2025/05   »
일 월 화 수 목 금 토
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31
글 보관함

Blog is powered by Tistory / Designed by Tistory

티스토리툴바