"본 글은 2013년 11월 12일 지디넷코리아에 기고한 칼럼입니다." 최근 빅데이터 분석에서 실시간(real-time) 처리에 대한 요구가 늘었다. 주요 빅데이터 기술로 널리 사용하는 하둡(Hadoop)은 배치 처리에 기반해, 하둡 맵리듀스 동작 시간을 최대한 줄일 수는 있어도 실시간 처리에는 한계가 있다. 빅데이터 분석은 그동안 처리하지 못했던 많은 데이터에서 의미있는 정보를 추출해 내는 것이므로 필자는 처음에만 해도 실시간 처리는 큰 의미가 없을 것으로 판단했던게 사실이다. 그러나 데이터 분석 컨설팅을 진행하면서 실시간 처리에 대한 요구가 꽤 높다는 것을 알게 됐다. 예를 들어, 새로운 모바일 앱을 출시했을 때 사용자 증가 추이를 바로 확인하거나 광고 프로모션을 진행한다면 실시간으로 광고 효과를 알..
제2회 클라우드 & OSS 컨퍼런스가 5월 29일(수) 열립니다. 국내외 클라우드 서비스와 현황을 확인할 수 있는 자리가 될 것 같은데요. MS, Redhat, Tgrape 등이 참여해서 행사를 진행하게 됩니다. 일시: 2013년 5월 29일(수) 13:30 ~ 18:00 장소: 호텔리베라 3층 베르사이유 그랜드볼륨 (서울 강남구 청담동 위치) 대상: 클라우드 컴퓨팅 유관 공공, 기업 고객 및 개발자 참가비: 사전등록 - 무료, 현장등록 - 2만원 Mobile Analytics Platform "Fingra.ph"라는 주제로 저도 발표를 하고 전시 부스도 운영합니다. 발표에서는 클라우드 기반의 서비스로서의 모바일 분석에 대해서 이야기를 하려고 합니다. 참가신청은 http://onoffmix.com/eve..
다우기술과 레드햇에서 주최하는 오픈소스 심포지엄입니다. 무료인 것 같구요. linux, Jboss, Mysql과 같은 오픈소스에 관심이 있는 분들에게 도움이 될 것 같네요 일시 : 2007년 11월 22일(목) 13:00 ~ 18:30 장소 : 잠실 롯데호텔 크리스탈볼륨 3F (미니맵으로 위치 보기)Infra Track과 Application Track으로 나누어 진행하는데요.. Infra Track에서는 레드햇 리눅스에 대한 이야기를 주로 하고, Application Track에서는 Jboss, Mysql에 대한 이야기를 하는 것 같네요.. 안내사이트는 http://www.key-on.co.kr/redhat/oss_overview.htm 이구요 등록사이트는 http://www.key-on.co.kr/r..
루씬 인 액션 - 에릭 해쳐.오티스 고스포드네티츠 지음, 이문호 외 옮김/에이콘출판 프로젝트를 수행할 때마다 항상 고민이 되는 것이 바로 검색엔진이었던 것 같습니다. 상업용 검색엔진을 이용하면 비용이 발생하고, 그렇다고 DB 검색으로만 붙여놓기에는 늘어나는 정보의 양이 부담이 되었죠.. 아마 그때 루씬이라는 오픈소스를 알고 있었다면 한번쯤 적용해 보자고 했었을 수도 있었을 것 같네요. ^^ 물론 이 책에도 잘 나와 있지만 한글에 대한 분석기가 완벽한 것이 없어서 실제 적용에는 많은 한계가 있을 겁니다. 하지만 많은 개발자들이 관심을 가진다면 이것도 머지 않아 해결되지 않을까 하네요~ 책 자체로 보면 번역서라고 믿기지 않을 정도로 매끄럽게 되어 있습니다. 검색엔진에 대한 "색인", "쿼리(질의어)", "분..