https://www.anandtech.com/show/14407/amd-ryzen-3000-announced-five-cpus-12-cores-for-499-up-to-46-ghz-pcie-40-coming-77 ...

Gepostet von Daniel Hong am Montag, 27. Mai 2019

https://www.anandtech.com/…/amd-ryzen-3000-announced-five-c…

와... 이 회사가 불과 3-4년 전까지만 해도 파산 직전 상태였던 그 AMD와 같은 회사가 맞나 싶다. K10(페넘) 시리즈에 이어 "차세대 야심작"이었던 불도저(FX)까지 인텔에 완패하면서 세미커스텀 사업과 저가 프로세서 이외에는 전혀 소생의 기미가 보이지 않았는데, 사실상 마지막 희망이었던 Zen이 대성공을 거두면서 상황을 완벽하게 반전시켰다. 거기다 오늘은 "치플렛" 디자인을 메인스트림 데스크탑에 사용해, 무려 12코어 프로세서를 AM4 소켓용 제품으로 내놓은 것이다.

2014년 10월에 AMD의 회장 겸 CEO로 취임한 리사 수 박사는, 우선 회사를 정상궤도에 올려놓고 차세대 아키텍처 디자인에 필요한 자금을 확보하는 것이 급선무라고 판단한 듯하다. 2015년 초까지 그는 AMD의 주수입원을 고전하던 PC 시장이 아닌, 세미커스텀 및 임베디드 시장으로 완전히 바꾸어 놓았다. MS와 소니의 차세대 콘솔에 모두 AMD 칩을 탑재하도록 설득해낸 데 이어, 애플을 비롯한 유수의 OEM들을 고정 고객으로 확보했다. 의료용 기기나 POS 등에 탑재되는 임베디드 칩 분야에서도 (가격과 높은 설계 자유도를 내세워) 서서히 저변을 넓혔다.

이러한 일이 가능했던 이유는, AMD가 CPU와 GPU IP 포트폴리오를 모두 갖춘 회사이기 때문이다. 컴퓨팅 시스템에서 필수적인 두 가지 설계를 모두 가지고 있는 유일한 회사인 만큼, AMD는 (경쟁사들과 달리) 고객사의 요구사항에 맞춘 칩을 맞춤생산해 납품할 수 있었다. 절대적인 성능이 중요하지 않은 세미커스텀/임베디드 시장에서는 이것이 결정적인 강점으로 작용했고, 이 시장을 개척해 아키텍처 연구개발을 위한 기초 자금을 확보해낼 수 있었던 것이다.

세미커스텀 사업으로 어느 정도의 자금을 확보했다고는 하나, AMD는 2016년까지도 파산설이 끊임없이 들려올 정도로 자금력이 매우 취약한 상태였다. 따라서, AMD의 마지막 희망이라 불렸던 차세대 프로젝트 "Zen"은 모든 면에서 연구개발 및 생산 비용을 최대한 절감할 수밖에 없었다. 그렇다고 인텔에 또다시 성능 면에서 밀리는 제품을 내놓았다간 자칫 회사 자체의 존립이 위험해질 수도 있는 상황이었다.

Zen의 아키텍처 디자인에는 이러한 비용 절감을 위한 경영전략상 판단들이 그대로 녹아 있다. 강력한 자본력을 갖춘 인텔은 라인업별로 각기 다른 아키텍처와 칩 디자인을 사용하지만 (모바일 - 데스크탑 - HEDT - 서버), AMD에게는 그럴 만한 여유가 없었다. 따라서 Zen은 이 모든 시장을 단 하나의 설계로 공략할 수 있어야만 했다.

이뿐만이 아니라, AMD는 인텔과 같이 모든 코어와 IO를 포함한 프로세서 구성요소를 하나의 실리콘 - 즉 "빅칩" - 에 넣는 전략을 취할 수 없었다. 칩의 크기가 커질수록 생산비용이 크게 증가할 뿐 아니라, 웨이퍼 상 불량 포인트에 걸릴 확률 또한 높아지므로 폐기 / 컷팅으로 인한 잠재적 비용 지출까지 존재하기 때문이다.

따라서 Zen은 기존 x86 진영에서 잘 시도된 적 없었던, 매우 독특한 설계를 가지게 되었다. Zen 풀칩에서는 코어 4개가 모여 CPU Complex (CCX)라는 기본 단위를 이룬다. 각각의 CCX는 Infinity Fabric이라는 내부 인터커넥트로 연결되는 구조를 가진다. 예컨대 8코어 Zen CPU는 4코어 CCX 2개, 6코어 Zen은 3코어 CCX 2개가 연결되어 있는 식이다. 이러한 구조 때문에, Zen 아키텍처는 레이턴시 면에서 인텔에 비해 극도로 불리하다. 워크로드가 서로 다른 CCX 간에 흩어지게 되면, CCX 간 통신을 위해 인피니티 패브릭을 거쳐야 하므로 레이턴시가 발생한다. 쓰레드리퍼와 같은 멀티 치플렛 구조의 경우, 서로 다른 치플렛의 메모리 컨트롤러에 연결되어 있는 메모리에 접근하기 위해서도 인피니티 패브릭을 거쳐야 하므로 랜덤 메모리 접근에서도 레이턴시가 발생한다. 인피티니 패브릭의 대역폭은 구조상 메모리 클록의 영향을 크게 받기 때문에, 레이턴시를 최소화하기 위해 사용자가 직접 높은 클록의 메모리를 선택해주어야 하는 구조가 되었다.

뭐 이런 비합리적인 구조가 다 있나 싶겠지만, Zen에서는 레이턴시의 균등성을 포기하는 대신 매우 중요한 속성을 취했다. 바로 아키텍처의 모듈화이다. 앞서 서술했듯 AMD는 연구개발 예산이 경쟁사에 비해 극도로 부족했기 때문에 각 시장별로 별도의 칩을 설계할 수 없었다. 따라서, 이를 만회하기 위해 각각의 프로세서 구성 요소를 최대한 모듈화하고 재활용하는 방식을 채택한 것이다. 예를 들어, 4코어 CCX 두 개를 이어붙이면 8코어 Zen 데스크탑 풀칩인 “제플린”이 되지만, 같은 설계에서 CCX 1개를 빼고 그 자리에 베가 GPU를 붙이면 노트북과 저가 PC에 탑재할 수 있는 APU가 된다.

같은 접근을 사용하면 칩 설계를 거의 변경하지 않고 HEDT와 서버 제품까지 만들어낼 수 있다. 다만 이 때는 칩 내에서 구성요소를 바꾸는 것이 아니라, 8코어 제플린 칩을 인피니티 패브릭을 이용해 병렬로 이어붙인다. 이렇게 제플린 칩 2개를 붙인 것이 AMD의 16코어 HEDT인 쓰레드리퍼, 4개를 이어붙인 것이 서버 칩인 에픽이다. 2세대인 Zen+에 와서는, 쓰레드리퍼에서도 제플린 4개를 이어붙여 32코어 쓰레드리퍼를 만들어냈다. (물론 에픽과의 차별화를 두기 위해, 제플린 4개 중 2개에서는 메모리 컨트롤러를 비활성화해 서버용 칩의 우위를 유지했다.)

이러한 모듈형 설계는 AMD가 극도로 제한된 예산을 가지고도 인텔과 경쟁할 수 있는 수준의 칩을 만들어내는 데에 크게 기여했다. 일단 고성능 코어를 만드는 데에 가능한 모든 역량을 쏟아붓고, 나머지 부수적인 요소들에 소요되는 비용을 최소화한 것이다. 예컨대, Zen의 모듈형 구조 덕분에 AMD는 데스크탑 라이젠과 쓰레드리퍼, 에픽 제품군을 위해 별도의 칩을 설계하고 생산할 필요가 없다. 제플린 한 종류만 설계해 대량생산한 후, 수율에 따라 적절히 커팅해 이어붙이면 데스크탑, HEDT, 서버용 제품군을 모두 하나의 칩 생산 라인에서 만들 수 있다. 어마어마한 비용효율성이다.

Zen의 모듈형 설계는 비용효율 말고도 또다른 어마어마한 강점을 가져왔다. 바로 프로세서의 손쉬운 병렬 확장이다. 다시 말해, 큰 노력을 들이지 않고 코어 수를 쉽게 늘릴 수 있다는 뜻이다. 인텔은 현재 제품군별로 별도의 프로세서 아키텍처와 칩 설계를 만들어두고, 거기에서 커팅해 내려가는 방식을 채택하고 있다. 데스크탑/서버용 영역에서는 일반적으로 메인스트림용 칩과 서버/HEDT용 칩 3종(LCC/HCC/XCC)으로 총 4종의 칩 설계가 존재하는데, 현재 인텔의 하이엔드 아키텍처인 스카이레이크-X에서만 10코어 설계 (LCC), 18코어 설계 (HCC), 28코어 설계 (XCC)의 3가지 칩이 존재하고 (…) 메인스트림 영역에서는 (인텔이 라이젠에 대응해 코어 수를 점점 늘려나감에 따라) 세대별로 각각 4코어, 6코어 (커피레이크), 8코어 (커피레이크 리프레시) 칩 설계가 각각 따로 존재한다. 노트북 등에 쓰이는 저전력/모바일 제품군 아키텍처와 칩 설계는 포함하지도 않았는데도 이렇게 많다.

이런 인텔의 접근으로는 프로세서의 병렬적 확장에 분명한 한계가 존재할 수밖에 없다. 예컨대 8코어 라이젠 데스크탑에 대응하기 위해 8코어 데스크탑 칩을 완전히 새롭게 설계해야 하고, 16코어 쓰레드리퍼에 대응하기 위해 (본래 서버용이었던) 18코어 HCC 칩을 HEDT 시장에 투입할 수밖에 없었다 (코어 i9-7980XE/9980XE). 그마저도 AMD가 제플린 4개를 이어붙인 32코어 쓰레드리퍼 (TR-2990WX)를 내놓자 제대로 대응하지 못하다가, 본래 최상위 서버용 라인업용으로 설계되었던 28코어 XCC 칩을 터보 4.3GHz로 오버클럭한 (…) 괴상한 제품을 내놓는 지경에 이르렀다 (올초에 인텔이 발표한 제온 W-3175X). 이마저도 AMD가 젠2 서버 칩인 Rome으로 64코어 (…) 제품을 내놓자 곧바로 밀려날 위기에 처했다. 당장 64코어 제품이 HEDT인 쓰레드리퍼에까지 내려오면 인텔에게는 더 이상 대응할 카드가 없다. 64코어에 대응할 새 칩을 새로 설계하고, 대량생산까지 진행하는 데에 얼마만큼의 시간이 걸릴지 알 수 없으며, 기존 설계를 따르는 칩들의 재고까지 떠안아야 하기 때문이다. 거기에 현재의 빅칩 커팅 방식으로는 TDP에서조차 AMD에 밀릴 수밖에 없다 (칩의 면적 자체를 줄일 수 없으므로). 설상가상으로 자사 팹과의 이해관계로 인한 차세대 공정 도입 지연과 (4년째 14nm 공정 개량해 쓰는 게 말이나 되는지…) 프로세서 보안 이슈까지 연달아 터지며 전면적인 전략 수정 없이는 무섭게 추격해오는 AMD의 공세를 막을 수 없는 지경까지 이르렀다.

이런 상황에 AMD가 젠2로 한 번 더 강펀치를 날린 셈이 됐다. 젠2는 오리지널 젠보다 더욱 더 극단적인 모듈화를 취하고 있다. 실제로 프로세싱을 수행하는 코어와 프로세서의 (메모리 컨트롤러를 포함한) 나머지 구성요소를 별도의 칩으로 분리했다. 이 8코어짜리 “코어 다이” 자체만 7nm 공정으로 생산하고, 나머지 구성요소가 포함된 “IO 다이”는 여전히 14nm 공정으로 생산한다. 값비싼 최첨단 공정으로 생산하는 칩 면적을 최소화하고, 나머지는 (상대적으로) 저렴하고 불량률이 낮은 14nm 공정을 사용함으로써 더욱 더 높은 수준의 비용효율화를 이루어냈다. 그리고 이 비용효율화로 얻은 이점을 64코어 서버용 칩과 오늘 발표한 12코어 메인스트림 데스크탑 칩으로 그대로 소비자에게 돌려줬다. 구 AMD 팹인 글로벌파운드리와의 14nm 계약 물량도 지키면서, 더 기술력이 앞서 있는 TSMC의 7nm 공정으로 이전할 수 있는 신의 한 수이기도 했다. 자체 팹의 영향력에서 벗어날 수 없는 인텔과 대비되는, “팹리스” 기업의 강력한 이점이라고 하겠다.

이런 기술적인 수준의 비용최적화는, 이전 전문경영인 체제 하에서는 도저히 이루어질 수 없는 수준의 것들이었다. 레노버 COO 출신의 전 AMD CEO였던 로리 리드는 AMD의 제품군 포트폴리오를 다변화하는 방식으로 (앞서 언급했듯) 수익성을 크게 향상하기는 했으나, IBM과 프리스케일에서 실제 반도체 기술을 직접 연구개발한 기술자였던 리사 수처럼 기술을 기반으로 한 비용최적화를 구사하지는 못했던 듯하다. 세상에 어느 전문경영인이 저런 식으로 아키텍처 면에서의 비용최적화를 이끌어 낼 수 있겠는가 (…) 모듈화 접근을 통해 극도로 제한된 예산으로 인텔에 대적할 만한 칩을 만들 수 있었던 데에는 결국 기술에 대한 깊은 이해와 경험이 바탕이 되지 않았나 싶다.

결국 기술기업을 가장 효율적으로 경영하려면 경영자 자신도 기술에 대한 깊은 이해를 가지고 있어야 하나 보다. 책상에서 재무적인 숫자만 굴리면서 경영하는 시대는 지나갔다.