반응형 PageRank1 [hadoop] 하둡 PageRank 알고리즘 개념과 MapReduce를 이용한 실습 Hadoop 기반 PageRank 실습 블로그PageRank 알고리즘 개요PageRank는 웹페이지 간의 링크 구조를 바탕으로 페이지의 상대적인 중요도를 측정하기 위한 알고리즘으로, 구글의 공동 창업자 Larry Page와 Sergey Brin이 개발하였다. 이는 그래프 형태로 표현된 웹 구조에서 각 노드(페이지)의 중요도를 반복적으로 계산하여 수렴시키는 방식이다.핵심 개념링크는 투표다: A가 B로 링크를 건다면, 이는 A가 B를 중요하다고 ‘투표’한 것이다.중요한 페이지로부터 받은 투표는 더 큰 가치가 있다.링크를 많이 건 페이지는 투표 가치를 나눠준다.모든 페이지의 PR 값은 반복 계산을 통해 안정화된다.Damping Factor (보통 0.85): 링크를 따라갈 확률. 나머지는 무작위 이동.행렬 기.. 2025. 4. 20. 이전 1 다음