Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.
Tip
title새 문서 공간에 오신 것을 환영합니다!


빅데이터를 다루는 기술들과 기술및 툴들과 그것을 다시 이용하는 AI기술들을 정리하는 공간입니다.



분석에 사용되는 데이터의 종류

  • 시스템로그
  • 어플리케이션로그
  • RDB에 적재된 중요 데이터
  • 사용자유입및 트래킹로그
  • 중요이벤트(결제,취소등)
  • 크롤링데이터: 내부서비스에서 생산하지 못하는정보  

시스템로그와 어플리케이션로그를 간과하는 경우가 많습니다. 로그 설계가 잘되어있으면

중요이벤트및 성능향상을 위한 유입측정등 많은 분석이 가능합니다.

성능을 위해 로그레벨을 경고이상에서만 적는다.란 정책이 아무렇지 않게 결정되는것을 봤으며

이것은 아주 무지한 정책입니다. 당연히 시스템로그와 인포레벨의 어플리케이션로그는 실제로

가장큰 빅데이터가 되며, 정의한것만 빅데이터화를 한다고하면 분석의 대처가 늦어져서 

실제로 쓰임새가 있기까지 오랜시간이 걸리게됩니다.

그래서 저장소및 분석툴을 각각 전략별로 분리를하고 그것을 다시 통합하여 분석할수 있는

분석툴이 있어야된다라고 봅니다.  


분석툴

  • 엘라스틱서치/Splunk : 주로 어플리케이션 로그를 분석하여 의미있는 데이터를 찾기위한 용도 (BI가 주로사용) 
  • OpenNMS : 주로 시스템을 포함한 어플리케이션 모니터링을 위한툴이며 엘라스틱서치와도 연동이 되도록함 (데브옵스가 주로사용)
  • SPARK/주피터 : 빅데이터의 분석내용을 얼마나 빠르게하고 사용자에게 적절하게 제공할지 고민이 포함된 분석툴 (BA를 포함한 서비스개발자가 주로사용)



이 문서 검색

Livesearch
spaceKeybdata

인기있는 주제

Popular Labels
spaceKeybdata
count10


특별 페이지

Content by Label
showLabelsfalse
spacesbdata
showSpacefalse
sorttitle
typepage
cqllabel = "featured" and type = "page" and space = "bdata"
labelsfeatured

최근에 변경된 페이지

Recently Updated
typespage
max5
hideHeadingtrue
themeconcise