투수 지표 가이드 Part 1: 전통 지표부터 세이버메트릭스까지
이 글은 Claude Opus 4.6 을 이용해 초안이 작성되었으며, 이후 퇴고를 거쳤습니다.
들어가며#
야구는 “기록의 스포츠"라고 불립니다. 특히 투수는 경기의 흐름을 좌우하는 핵심 포지션으로, 오랜 세월에 걸쳐 다양한 통계 지표가 개발되어 왔습니다. 전통적으로 승수(W)와 평균자책점(ERA)이 투수 평가의 기준이었지만, 2000년대 이후 세이버메트릭스의 부상과 함께 FIP, xFIP, SIERA 등 새로운 지표들이 투수의 실력을 더 정밀하게 측정하고 있습니다.
이 시리즈에서는 투수 평가에 사용되는 주요 지표들을 체계적으로 정리하고, 이를 활용해 투수의 스타일을 분석하고 미래 성적을 예측하는 방법까지 다룹니다. 각 지표를 설명할 때마다 실제 MLB 투수들의 데이터를 함께 살펴보겠습니다.
- Part 1 (이번 글): 전통 지표와 세이버메트릭스 지표 소개
- Part 2: 지표를 활용한 투수 스타일 분석과 미래 성적 예측
전통 지표: 기본이지만 한계가 있는 수치들#
전통 지표는 오랜 역사를 가지고 있으며, 팬들이 가장 먼저 접하는 숫자들입니다. 직관적이라는 장점이 있지만, 투수 본인의 능력 외적인 요소가 많이 개입된다는 한계를 가지고 있습니다.
승패 (W-L, Wins-Losses)#
가장 오래된 투수 평가 기준입니다. 과거에는 “20승 투수"가 에이스의 상징이었고, 사이영상 투표에서도 승수가 결정적인 역할을 했습니다.
한계: 승패는 투수의 능력보다 팀의 타선과 불펜 지원에 크게 좌우됩니다. 제이콥 디그롬(Jacob deGrom)의 2018시즌이 이를 극명하게 보여줍니다.
| 투수 | 팀 | ERA | W-L | 경기당 평균 득점 지원 |
|---|---|---|---|---|
| 제이콥 디그롬 | NYM | 1.70 | 10-9 | 3.5 |
| 맥스 슈어저 | WSH | 2.53 | 18-7 | 4.8 |
디그롬은 역대급 ERA(1.70)를 기록하고도 10승에 그쳤습니다. 뉴욕 메츠의 빈약한 타선이 그가 등판한 경기에서 평균 3.5점밖에 뽑아주지 못했기 때문입니다. 그럼에도 사이영상을 수상한 것은 세이버메트릭스의 영향력이 커진 결과였습니다.
2010년 시애틀 매리너스의 펠릭스 에르난데스도 비슷한 케이스입니다. ERA 2.27을 기록하고도 13승 12패에 그쳤지만, 같은 해 ERA 3.18의 CC 사바시아가 21승을 거둔 것과 대비되며, 승수의 한계를 잘 보여줍니다.
활용 가치: 현대 야구에서 승패는 투수 개인의 능력 지표로서는 거의 의미가 없습니다. 다만 팀의 전반적인 경쟁력을 간접적으로 보여주는 맥락 지표로는 참고할 수 있습니다.
평균자책점 (ERA, Earned Run Average)#
투수가 9이닝당 허용한 자책점의 평균입니다.
ERA = (자책점 × 9) / 투구 이닝
기준선:
| ERA | 평가 | 대표 시즌 |
|---|---|---|
| 2.00 이하 | 엘리트 | 페드로 마르티네스 2000 (1.74), 디그롬 2018 (1.70) |
| 2.00~3.00 | 우수 | 클레이턴 커쇼 2015 (2.13), 맥스 슈어저 2017 (2.51) |
| 3.00~4.00 | 평균 이상 | 리그 평균 수준의 선발투수 |
| 4.00~5.00 | 평균 | |
| 5.00 이상 | 부진 |
페드로 마르티네스의 2000시즌(ERA 1.74, 217이닝)은 스테로이드 전성시대에 기록된 것이어서 더욱 경이롭습니다. 당시 아메리칸 리그 평균 ERA는 4.91이었으며, 페드로의 ERA+는 291로 역대 최고를 기록했습니다.
한계: ERA는 수비력의 영향을 크게 받습니다. 같은 투수라도 골드글러브 수비수들 뒤에서 던지면 ERA가 낮아지고, 수비가 약한 팀에서 던지면 ERA가 올라갑니다. 또한 “자책점"의 판정은 기록원의 주관이 개입되며, 실책 이후의 실점은 비자책점으로 처리되어 ERA에 반영되지 않는 불일치도 존재합니다.
WHIP (Walks plus Hits per Inning Pitched)#
이닝당 허용한 볼넷과 안타의 합계입니다.
WHIP = (볼넷 + 피안타) / 투구 이닝
역대급 WHIP 시즌:
| 투수 | 시즌 | WHIP | IP |
|---|---|---|---|
| 페드로 마르티네스 | 2000 | 0.74 | 217 |
| 클레이턴 커쇼 | 2014 | 0.86 | 198.1 |
| 그렉 매덕스 | 1995 | 0.81 | 209.2 |
| 크리스 세일 | 2018 | 0.86 | 158 |
페드로의 2000시즌 WHIP 0.74는 라이브볼 시대(1920년 이후) 최저 기록입니다. 9이닝당 볼넷과 안타를 합쳐 6.6개만 허용했다는 뜻입니다.
기준선:
| WHIP | 평가 |
|---|---|
| 1.00 이하 | 엘리트 |
| 1.00~1.20 | 우수 |
| 1.20~1.40 | 평균 |
| 1.40 이상 | 부진 |
한계: 볼넷과 안타를 동일한 가중치로 취급합니다. 실제로 볼넷(1루)과 2루타의 영향은 크게 다릅니다. 또한 피안타에는 인필드 안타처럼 수비 영향이 있는 것들도 포함됩니다.
탈삼진율 (K/9, Strikeouts per 9 Innings)#
9이닝당 기록한 삼진 수입니다.
K/9 = (탈삼진 × 9) / 투구 이닝
역대급 K/9 시즌들:
| 투수 | 시즌 | K/9 | 총 삼진 | IP |
|---|---|---|---|---|
| 거릿 콜 | 2019 | 13.82 | 326 | 212.1 |
| 크리스 세일 | 2017 | 12.93 | 308 | 214.1 |
| 랜디 존슨 | 2001 | 13.41 | 372 | 249.2 |
| 스펜서 스트라이더 | 2023 | 13.59 | 281 | 186.1 |
랜디 존슨의 2001시즌은 249.2이닝을 소화하면서 372삼진을 기록한 경이로운 시즌이었습니다. 현대 야구에서는 이닝 제한이 엄격해져 200이닝 이상 던지며 이 수준의 K/9를 기록하는 것은 거릿 콜의 2019시즌이 거의 마지막이었습니다.
기준선:
| K/9 | 평가 |
|---|---|
| 10.0 이상 | 엘리트 |
| 8.0~10.0 | 우수 |
| 6.0~8.0 | 평균 |
| 6.0 미만 | 낮음 |
한계: 삼진이 많다고 반드시 좋은 투수는 아닙니다. 삼진을 잡기 위해 투구 수가 늘어나면 이닝을 오래 소화하기 어려워집니다. 또한 K/9는 이닝 기반 지표이기 때문에, 같은 이닝 안에서도 많은 타자를 상대한 투수(볼넷이 많은 투수)가 유리하게 계산될 수 있습니다.
볼넷율 (BB/9, Walks per 9 Innings)#
9이닝당 허용한 볼넷 수입니다.
BB/9 = (볼넷 × 9) / 투구 이닝
제구의 달인들:
| 투수 | 시즌 | BB/9 | IP |
|---|---|---|---|
| 그렉 매덕스 | 1997 | 1.20 | 232.2 |
| 필 휴스 | 2014 | 0.97 | 209.2 |
| 클리프 리 | 2012 | 1.27 | 211 |
| 커트 실링 | 2002 | 1.07 | 259.2 |
그렉 매덕스는 커리어 전체에 걸쳐 BB/9 1.80을 기록했습니다. 90mph대 초반의 “느린” 패스트볼로도 통산 355승을 거둔 것은 역사적인 제구력 덕분이었습니다. 필 휴스의 2014시즌은 BB/9 0.97로, 209이닝 이상 던진 투수 중 역대 최저 기록입니다.
기준선:
| BB/9 | 평가 |
|---|---|
| 2.0 미만 | 엘리트 |
| 2.0~3.0 | 우수 |
| 3.0~4.0 | 평균 |
| 4.0 이상 | 부진 |
이닝 소화량 (IP, Innings Pitched)#
시즌 동안 소화한 총 이닝 수입니다. 단독으로 쓰이기보다 다른 지표와 함께 맥락을 제공합니다.
의미: “이닝 이터(Innings Eater)“라 불리는 200이닝 이상 소화 투수는 불펜 부담을 줄이고 팀에 안정감을 줍니다. 저스틴 벌랜더는 2011시즌 251이닝을 소화하며 ERA 2.40, 24승 5패로 사이영상과 MVP를 동시 수상했습니다. 양과 질을 동시에 달성한 대표적인 시즌입니다.
세이버메트릭스 지표: 투수 본연의 능력을 측정하다#
세이버메트릭스(Sabermetrics) 지표들은 투수가 통제할 수 있는 요소에 집중하여, 수비와 운의 영향을 제거한 “순수한 투수 능력"을 측정하려고 합니다.
FIP (Fielding Independent Pitching)#
FIP는 세이버메트릭스의 가장 대표적인 투수 지표입니다. 탈삼진, 볼넷, 피홈런이라는 세 가지 요소만으로 투수를 평가합니다. 이 세 가지는 투수가 수비의 도움 없이 직접 통제하는 결과물이라는 점에서 “Three True Outcomes(TTO)” 라고 불립니다.
FIP = ((13 × 피홈런) + (3 × 볼넷) - (2 × 탈삼진)) / 투구이닝 + 상수
여기서 상수(cFIP)는 리그 평균 ERA와 FIP를 맞추기 위한 보정값으로, 보통 3.10 전후입니다.
ERA와 FIP가 극단적으로 괴리된 실제 사례:
| 투수 | 시즌 | ERA | FIP | 차이 | BABIP | LOB% |
|---|---|---|---|---|---|---|
| 마르코 에스트라다 | 2015 | 3.13 | 4.28 | -1.15 | .236 | 78.8% |
| 마커스 스트로만 | 2018 | 5.54 | 3.97 | +1.57 | .357 | 65.5% |
에스트라다는 2015시즌 ERA 3.13으로 훌륭해 보였지만, FIP는 4.28이었습니다. BABIP가 .236으로 극히 낮았는데, 이는 수비 운이 크게 작용한 결과였습니다. 예상대로 2016시즌 ERA는 3.48로 상승했습니다. 반대로 스트로만은 2018시즌 BABIP .357이라는 극도의 불운을 겪었고, 2019시즌 ERA 3.22로 큰 폭의 개선을 보여주었습니다.
한계: 피안타의 질(타구 유형)을 전혀 반영하지 않습니다. 예를 들어, 땅볼을 많이 유도하는 투수는 인플레이 타구가 안타가 될 확률이 낮은데, FIP는 이를 고려하지 않습니다. 또한 홈런에 13이라는 높은 가중치를 부여하기 때문에, 홈런 변동성이 큰 투수의 FIP는 시즌 간 변동이 클 수 있습니다.
xFIP (Expected Fielding Independent Pitching)#
FIP에서 한 걸음 더 나아간 지표입니다. FIP의 피홈런 대신 “예상 피홈런"을 사용합니다. 구체적으로, 해당 투수의 플라이볼 수에 리그 평균 홈런/플라이볼 비율(HR/FB%)을 적용합니다.
xFIP = ((13 × (플라이볼 × 리그평균 HR/FB%)) + (3 × 볼넷) - (2 × 탈삼진)) / 투구이닝 + 상수
HR/FB% 변동이 FIP에 미치는 영향 — 매트 하비 사례:
| 시즌 | ERA | FIP | xFIP | HR/FB% |
|---|---|---|---|---|
| 2013 | 2.27 | 2.00 | 2.69 | 5.4% |
| 2015 | 2.71 | 3.22 | 2.94 | 11.4% |
매트 하비(Matt Harvey)의 2013시즌에는 HR/FB%가 5.4%로 극히 낮았습니다. FIP(2.00)는 이 낮은 홈런율을 그대로 반영했지만, xFIP(2.69)는 리그 평균 HR/FB%를 적용하여 더 현실적인 수치를 제시했습니다. 2015시즌에 HR/FB%가 11.4%로 정상화되면서 FIP가 3.22로 올랐지만, xFIP(2.94)와의 차이는 줄어들었습니다.
한계: 홈런이 순전히 운이라는 가정에 기반합니다. 하지만 실제로 일부 투수는 구질 특성상 지속적으로 높거나 낮은 HR/FB%를 기록합니다. 플라이볼 투수가 구장 효과(예: 콜로라도 쿠어스 필드) 와 결합하면 더 큰 괴리가 생길 수 있습니다.
SIERA (Skill-Interactive ERA)#
FIP와 xFIP보다 더 정교한 지표입니다. 탈삼진, 볼넷, 땅볼 비율 사이의 상호작용을 반영합니다.
핵심 통찰: SIERA의 가장 중요한 아이디어는 “같은 볼넷이라도 삼진이 많은 투수에게 더 해롭다"는 것입니다. 삼진을 많이 잡는 투수는 풀 카운트까지 가는 경우가 많으므로, 볼넷 하나의 비용이 더 큽니다(투구 수 증가, 이닝 소화 감소). 반면 컨택트 투수(땅볼 유도형)는 적은 투구 수로 아웃을 잡기 때문에 볼넷의 영향이 상대적으로 적습니다.
SIERA가 FIP보다 더 정확했던 사례 — 달라스 카이클(2014~2015):
| 시즌 | ERA | FIP | SIERA | K% | BB% | GB% |
|---|---|---|---|---|---|---|
| 2014 | 2.93 | 3.66 | 3.39 | 18.7% | 6.3% | 58.0% |
| 2015 | 2.48 | 3.22 | 3.12 | 19.5% | 5.7% | 58.5% |
카이클은 극단적인 그라운드볼 투수(GB% 58%)로, 삼진이 적은 대신 땅볼 유도로 아웃을 잡았습니다. FIP는 낮은 K%를 과도하게 페널티로 반영했지만, SIERA는 높은 GB%와의 상호작용을 고려하여 카이클의 실제 ERA에 더 가까운 수치를 제시했습니다.
K% / BB% (탈삼진율 / 볼넷율 비율 기반)#
K/9, BB/9의 이닝 기반 계산 대신, 상대한 타자 수 대비 비율로 계산한 지표입니다.
K% = 탈삼진 / 상대 타자 수
BB% = 볼넷 / 상대 타자 수
K/9 대비 장점: K/9는 이닝 기반이라, 볼넷을 많이 주는 투수가 같은 이닝에서 더 많은 타자를 상대하게 되어 수치가 부풀려질 수 있습니다. K%는 이 문제를 해결합니다.
K-BB% 엘리트 시즌들:
| 투수 | 시즌 | K% | BB% | K-BB% |
|---|---|---|---|---|
| 거릿 콜 | 2019 | 39.9% | 6.0% | 33.9% |
| 코빈 번스 | 2021 | 35.6% | 4.6% | 31.0% |
| 크리스 세일 | 2017 | 33.2% | 5.3% | 27.9% |
| 셰인 비버 | 2020 | 36.2% | 3.5% | 32.7% |
거릿 콜의 2019시즌 K-BB% 33.9%는 현대 야구에서 거의 도달 불가능한 수준입니다. 상대 타자 10명 중 4명을 삼진으로 잡으면서 볼넷은 0.6명에게만 허용한 셈입니다.
| K-BB% | 평가 |
|---|---|
| 20% 이상 | 엘리트 |
| 15~20% | 우수 |
| 10~15% | 평균 |
| 10% 미만 | 부진 |
BABIP (Batting Average on Balls In Play)#
인플레이 타구(홈런 제외)가 안타가 된 비율입니다.
BABIP = (피안타 - 피홈런) / (타수 - 탈삼진 - 피홈런 + 희생플라이)
핵심 개념: 리그 평균 BABIP는 약 .300으로, 이 수치는 해마다 매우 안정적입니다. 개별 투수의 BABIP가 .250이면 수비 운이 좋았던 것이고, .340이면 수비 운이 나빴을 가능성이 높습니다.
BABIP 극단값과 다음 시즌 회귀 사례:
| 투수 | 시즌 | BABIP | ERA | 다음 시즌 BABIP | 다음 시즌 ERA |
|---|---|---|---|---|---|
| 짹 그레인키 | 2015 | .245 | 1.66 | .297 | 4.37 |
| 마커스 스트로만 | 2018 | .357 | 5.54 | .297 | 3.22 |
그레인키의 2015시즌(ERA 1.66)은 역대급이었지만, BABIP .245는 지속 불가능한 수준이었습니다. 다음 해 BABIP가 .297로 정상화되면서 ERA는 4.37로 크게 올랐습니다.
주의사항: BABIP가 지속적으로 리그 평균보다 낮은 투수도 있습니다. 높은 탈삼진율, 강한 땅볼 성향, 높은 인필드 플라이 비율을 가진 투수는 구조적으로 낮은 BABIP를 유지할 수 있습니다. 클레이턴 커쇼는 커리어 BABIP .271로 지속적으로 리그 평균보다 낮았는데, 이는 그의 엘리트급 구위와 높은 인필드 플라이 비율 덕분이었습니다. 맹목적으로 BABIP .300 회귀를 가정하면 안 됩니다.
LOB% (Left On Base Percentage)#
출루한 주자 중 득점하지 못하고 잔루로 남은 비율입니다.
LOB% = (피안타 + 볼넷 + 사구 - 실점) / (피안타 + 볼넷 + 사구 - (1.4 × 피홈런))
리그 평균: 약 72~73%
의미: LOB%가 85% 이상이면 “위기관리의 달인"처럼 보이지만, 대부분의 경우 지속 불가능한 행운입니다. 반대로 LOB%가 60% 이하면 불운이 많았을 가능성이 높습니다. ERA와 FIP의 괴리가 클 때, BABIP와 LOB%를 함께 보면 그 원인을 파악할 수 있습니다.
HR/FB% (홈런/플라이볼 비율)#
플라이볼 중 홈런이 된 비율입니다.
리그 평균: 약 10~13% (시즌과 공인구 사양에 따라 변동)
의미: 리그 평균에서 크게 벗어난 HR/FB%는 회귀할 가능성이 높습니다. 다만 구속, 구종 특성, 홈 구장에 따라 지속적으로 평균보다 높거나 낮은 투수도 존재합니다.
GB% / FB% / LD% (타구 유형 비율)#
투수가 허용한 타구를 땅볼(GB), 플라이볼(FB), 라인드라이브(LD)로 분류한 비율입니다.
| 유형 | 리그 평균 | 의미 |
|---|---|---|
| GB% | 약 43~45% | 높을수록 홈런 허용 감소, 단 내야 안타 증가 가능 |
| FB% | 약 34~36% | 높을수록 홈런 위험 증가 |
| LD% | 약 20~21% | 라인드라이브는 안타가 될 확률이 가장 높음 (약 .680) |
극단적 GB% 투수들:
| 투수 | 시즌 | GB% | ERA | HR/9 |
|---|---|---|---|---|
| 달라스 카이클 | 2015 | 58.5% | 2.48 | 0.51 |
| 잭 그레인키 | 2015 | 47.8% | 1.66 | 0.48 |
| 브랜든 웹 | 2006 | 60.8% | 3.10 | 0.59 |
달라스 카이클과 브랜든 웹은 60% 안팎의 GB%를 기록한 대표적인 극단적 땅볼 투수입니다. GB%가 높을수록 HR/9가 낮아지는 상관관계가 명확하게 보입니다.
차세대 지표: Statcast 시대의 데이터#
2015년부터 MLB 전 구장에 도입된 Statcast 시스템은 투수의 모든 투구를 추적하여 이전에는 측정할 수 없었던 데이터를 제공합니다.
Stuff+ / Location+ / Pitching+#
비교적 최근에 개발된 종합 모델 기반 지표입니다.
- Stuff+: 구속, 회전수, 무브먼트 등 구질 자체의 질을 평가합니다. 100이 평균이며, 높을수록 좋습니다. 120 이상이면 엘리트 구질입니다.
- Location+: 투구 위치의 질을 평가합니다. 스트라이크존 가장자리와 체이스 존(chase zone)에 얼마나 정확하게 던지는지를 측정합니다.
- Pitching+: Stuff+와 Location+를 결합한 종합 지표입니다.
Stuff+와 Location+의 대비 — 두 가지 유형의 에이스:
| 투수 | 시즌 | Stuff+ | Location+ | ERA |
|---|---|---|---|---|
| 스펜서 스트라이더 | 2023 | 140+ | 95 | 3.86 |
| 잭 그레인키 | 2019 | 85 | 120+ | 2.93 |
스트라이더는 압도적인 구질(Stuff+ 140+)로 삼진을 쏟아냈지만, 제구(Location+)가 평균 이하여서 ERA는 3.86에 머물렀습니다. 반대로 그레인키는 구질 자체는 리그 평균 이하였지만 정밀한 제구로 ERA 2.93을 기록했습니다.
활용: Stuff+가 높은데 성적이 나쁜 투수는 제구(Location+) 개선만으로 큰 성적 향상이 가능합니다. 반대로 Location+가 높지만 Stuff+가 낮은 투수는 노화에 따른 구속 저하에 취약할 수 있습니다.
CSW% (Called Strike + Whiff %)#
투구가 헛스윙(Whiff) 또는 보고 스트라이크(Called Strike)가 된 비율입니다.
CSW% = (Called Strikes + Whiffs) / 총 투구 수
기준선:
| CSW% | 평가 |
|---|---|
| 32% 이상 | 엘리트 |
| 29~32% | 우수 |
| 27~29% | 평균 |
| 27% 미만 | 부진 |
의미: 투수가 타자를 얼마나 효과적으로 압도하는지를 보여줍니다. 높은 CSW%는 높은 삼진율과 강한 상관관계가 있습니다. 코빈 번스의 2021시즌은 CSW% 35.4%로, 투구 3개 중 1개 이상이 헛스윙이거나 보고 스트라이크였습니다.
Hard Hit% / Barrel%#
- Hard Hit%: 타구 속도(Exit Velocity)가 95mph 이상인 타구의 비율
- Barrel%: 이상적인 타구 속도와 발사각의 조합(“배럴”)이 된 타구의 비율
Statcast 지표로 본 엘리트 투수들 (2021시즌):
| 투수 | Hard Hit% | Barrel% | ERA |
|---|---|---|---|
| 코빈 번스 | 24.5% | 3.1% | 2.43 |
| 맥스 슈어저 | 29.5% | 4.8% | 2.46 |
| 리그 평균 | 38.6% | 7.6% | 4.26 |
번스는 2021시즌 Hard Hit%와 Barrel% 모두 리그 최저 수준을 기록하며, 타자들이 그의 공을 제대로 때리지 못했음을 보여줍니다. 이 지표들은 ERA나 BABIP에 비해 더 빠르게 투수의 실제 피타 능력을 포착합니다.
전통 지표 vs 세이버메트릭스 지표: 비교 요약#
| 측면 | 전통 지표 | 세이버메트릭스 지표 |
|---|---|---|
| 대표 지표 | ERA, W-L, WHIP | FIP, xFIP, SIERA |
| 수비 영향 | 포함됨 | 제거됨 |
| 운의 영향 | 포함됨 | 최소화됨 |
| 직관성 | 높음 | 낮음 (학습 필요) |
| 예측력 | 낮음 | 높음 |
| 표본 크기 민감도 | 낮음 | 높음 (소표본에서 변동 큼) |
| 최적 용도 | 결과 기술 | 능력 평가 및 예측 |
마무리#
이번 글에서는 투수 평가에 사용되는 주요 지표들을 전통 지표, 세이버메트릭스 지표, 그리고 Statcast 기반 차세대 지표로 나누어 살펴보았습니다. 각 지표는 고유한 강점과 한계를 가지고 있으며, 어떤 단일 지표도 투수의 능력을 완벽하게 설명하지 못합니다.
Part 2에서는 이러한 지표들을 실제로 어떻게 조합하여 투수의 스타일을 분류하고, 미래 성적을 예측하는지 실제 MLB 투수들의 연도별 데이터를 비교하며 다루겠습니다.