Performance 및 Token Velocity
사용자들이 모델의 처리 속도에 매우 깊은 인상을 받았으며, 특히 Claude나 Gemini 같은 업계 리더들과 비교했을 때 높은 tokens-per-second 수치를 기록했다는 점에 주목하고 있습니다.
사용자들은 Grok 4.3의 인상적인 Performance와 Token Velocity를 칭찬하지만, 다른 주요 AI 모델들에 비해 비싼 Subscription Pricing과 논란이 되는 Political Bias에 대해서는 여전히 비판적인 입장을 유지하고 있습니다.
사용자들이 모델의 처리 속도에 매우 깊은 인상을 받았으며, 특히 Claude나 Gemini 같은 업계 리더들과 비교했을 때 높은 tokens-per-second 수치를 기록했다는 점에 주목하고 있습니다.
높은 구독 비용과 결제 장벽에 대한 광범위한 불만이 존재하며, 많은 사용자들이 프리미엄 가격이 실제 유용성에 부합하는지 의문을 제기하고 있습니다.
Grok의 검열 부재를 두고 커뮤니티의 의견이 나뉩니다. 일부는 필터링 없는 특성을 높게 평가하는 반면, 다른 많은 이들은 정치적 확증 편향(political bubbles)과 허위 정보를 강화한다고 비판합니다.
기술적인 논의에 따르면 Grok 4.3은 메모리 유지력, hallucination 발생률, 훈련 데이터의 신뢰성 문제로 인해 Opus-level 지능에는 미치지 못하는 것으로 보입니다.
Elon이 주장하는 대로 여전히 500b 모델이라면 나쁘지 않네요.“if still its a 500b model as elon claims, its not bad”
소형 모델치고는 꽤 괜찮네요.“It's a small model, pretty good actually.”
기본적으로 MiMo V2.5 Pro 수준이지만 tps는 훨씬 빠릅니다. MiMo는 오픈 소스이지만 Grok은 아니라는 점이 눈에 띄네요.“basically MiMo V2.5 Pro level but much faster tps. - notably MiMo is open source, grok isnt.”
4.3은 여전히 500b 체크포인트인데... 현재 나온 500b 모델 중 최고가 아닐까 싶네요. 제가 틀렸다면 알려주세요. Grok 4.3보다 상위에 있는 6개 모델들의 크기는 어느 정도인가요? 수정: Sonnet 4.6만큼 똑똑하면서 5배는 더 저렴하고 빠르네요... 흠.“4.3 is still a 500b checkpoint... Might be the best 500b model out I guess or ? Correct me if I am wrong. What size is the 6 models above Grok 4.3 ? [https://artificialanalysis.ai/models#intelligence-tabs](https://artificialanalysis.ai/models#intelligence-tabs) edit : It is as smart as Sonnet 4.6 and 5x cheaper and faster ...hmm”
무료 deep goon tier 때문에 설레는 사람들이 많았죠 🤭 Colossus 2는 5월 13일로 예정되어 있고, 내년에 OpenAI가 Super Saiyan이 되기 전까지는 xAI를 AI 연산의 리더로 만들어줄 겁니다.“The free deep goon tier had a lot of people "excited" 🤭 Colossus 2 is scheduled for May 13 and will make xAI the AI compute leader until OpenAI goes Super Saiyan next year [according to this](https://epoch.ai/data/data-centers?view=graph&tab=power&mode=top-1&colorCategorization=primaryUser&colorPinned=OpenAI)”
저는 음악 프로듀서인데 새로 출시되는 모델들에게 항상 가사를 써보라고 시킵니다. 왠지 모르겠지만 AI는 마법 같은 일은 잘하면서도 제대로 된, 진부하지 않은 가사는 못 쓰거든요 😂 가사를 써보신다면 어떤 장르든 상관없으니 보고 싶네요. 그리고 Grok의 검열이 없다는 점도 마음에 듭니다.“I'm a music producer and I always like to ask new released models to make some type of lyrics, cause, for some reason, AI can make magical things but can't write decent/non generic lyrics 😂 If you happen to try some lyrics, any type you want, I would love to see them. Also something I like about grok is the lack of censorship it has.”
초당 209 토큰이라니, 이게 유지된다면 Grok 4.3은 정말 빠르네요. ~ Artificial analysis“This is nice actually if it holds: > At 209 tokens per second, Grok 4.3 is notably fast. ~ Artificial analysis”
4.2가 현재 다른 모델들을 압도하고 있는데 alpha arena에서는 어떤 성능을 보여줄지 궁금하네요.“I wonder how it’s gonna perform on alpha arena cause 4.2 is whooping the rest of the models currently”
저는 보통 다른 회사 제품을 선호하지만, Grok이 유독 뛰어난 부분은 모호한 정보 검색, 특히 게임 관련 정보입니다. 90년대 쉐어웨어 게임에 대한 구체적인 내용을 찾으려 할 때 Grok을 사용하죠. 다른 분들도 Grok에서 비슷한 경험을 하셨는지 모르겠네요.“I generally prefer other companies, but the one area grok has excelled at for me is searching obscure information, specifically gaming related info. If I'm trying to figure out something specific about some shareware game from the 90s, I go to grok. Idk if other people have had similar results with grok.”
아직 많이 써보지는 않았지만 dynamic vocabulary가 늘어난 것 같긴 한데, 몇 주간 사용하지 않고 테스트하기는 어렵네요. 하지만 한 가지 눈에 띄는 점은 이제 사용자의 의도를 더 잘 추론할 수 있어서(즉, 사용자가 해를 끼치려는 게 아니라 특정 주제를 안전하게 탐구하고 있다는 것) 심한 차단 없이 논란이 되는 주제에 대해 토론할 수 있다는 점입니다. 엄청나게 다르지는 않지만 분명 약간의 향상이 있습니다. 심리학 문헌 연구에 채팅을 사용하는데 그렇습니다. 층층이 겹쳐진 시를 해독하는 테스트도 해봤는데 4.20보다 점수가 훨씬 높지는 않았습니다. 그래서 4.3은 그냥 4.20인 것 같네요...“havent pushed it too far, it seems dynamic vocabulary miiiiight be increased, but it’s difficult to really test without weeks of usage. However, one thing I noticed is it is able to discuss more controversial topics without hard-blocks now as it is able to better reason your intention (i.e. user isnt being harmful, they are exploring xyz topic in a safe manner) Not wildly different but definitely a slight increase. I use the chat for psych lit research and yes. I tested it in deciphering some heavily layered poetry as well but it didnt score much better than 4.20. So I assume 4.3 is just 4.20 with more training”
그래프는 각 게시물의 추출 샘플(n≤30) 기반
simianwords
r/singularity
r/singularity
r/singularity
r/singularity
r/grok
Vaibhav Sisinty
Flash Discovery
Creator House
Bijan Bowen
WorldofAI
Rafa Silva
조코딩 JoCoding
BitBiasedAI
TheAIGRID