Tôi đã thử nghiệm các công cụ AI từ những ngày đầu và tôi phải nói - Claude 4 là một cái gì đó đặc biệt. Khi nhân học bỏ các mô hình mới nhất của họ vào ngày 22 tháng 5 năm 2025, tôi đã dành một ngày cuối tuần đầy đủ để đưa họ qua các bước đi của họ. Những gì tôi tìm thấy không chỉ là một bản cập nhật gia tăng khác - đó là một bước tiến chính hãng mà tôi đã suy nghĩ lại về những gì AI thực sự có thể làm.
Trong lần lặn sâu này, tôi sẽ hướng dẫn bạn những gì làm cho Claude 4 khác nhau, chia sẻ một số ví dụ trong thế giới thực đã thổi bay tôi và giải thích cách bạn có thể sử dụng một công cụ thông minh có tên là Dicloak Antidetect Trình duyệt để chia sẻ quyền truy cập với nhóm của bạn mà không phá vỡ ngân hàng (hoặc các điều khoản dịch vụ).
Bạn có nhớ khi các trợ lý AI là công cụ tìm kiếm được tôn vinh đôi khi bị ảo giác không? Những ngày đó cảm thấy ngày càng xa cách với Claude 4 .
Điều làm tôi ấn tượng ngay lập tức là cách Claude 4 không chỉ trả lời các câu hỏi - nó nghĩ bên cạnh bạn. Anthropic đã xây dựng một thứ gì đó giống như một công cụ và giống như một cộng tác viên nhớ bối cảnh của bạn, xây dựng trên các cuộc trò chuyện trước đây và thực sự tìm hiểu sở thích của bạn theo thời gian.
"Hôm nay, chúng tôi đang giới thiệu thế hệ tiếp theo của các mô hình Claude: Claude Opus 4 và Claude Sonnet 4, thiết lập các tiêu chuẩn mới cho mã hóa, lý luận nâng cao và các đại lý AI", Anthropic công bố trên trang web của họ. Nhưng công ty nói đó không nắm bắt được những gì làm cho bản phát hành này trở nên đặc biệt.
Nước sốt bí mật là phương pháp lý luận lai mới của Claude. Cả hai mô hình có thể chuyển đổi giữa các phản ứng nhanh và chế độ suy nghĩ sâu sắc hơn cảm thấy đáng chú ý ... tốt, con người. Khi tôi yêu cầu nó giúp gỡ lỗi một đoạn mã di sản đặc biệt khó chịu, nó đã dừng lại, suy nghĩ qua nhiều cách tiếp cận và thậm chí giải thích quá trình lý luận của nó theo cách giúp tôi hiểu được vấn đề cơ bản.
Là đồng nghiệp của tôi, Sarah (người dẫn đầu nghiên cứu AI tại công ty của chúng tôi) đã đặt nó: "Giống như có một nhà phát triển cao cấp nhìn qua vai bạn, nhưng một người không bao giờ thiếu kiên nhẫn hoặc phán xét mã lộn xộn của bạn."
Hãy nói về mô hình hàng đầu trước. Claude Opus 4 là dịch vụ hàng đầu của nhân học, và nó cho thấy. Trong thử nghiệm của tôi, nó đã xử lý mọi thứ, từ các nhiệm vụ mã hóa phức tạp đến các câu hỏi nghiên cứu sắc thái với độ sâu ấn tượng.
Các con số trở lại điều này-nó đạt 72,5% trên băng ghế SWE và 43,2% trên băng ghế đầu cuối, đánh bại cả GPT-4.1 (69,1%) và Gemini 2.5 Pro (63,2%). Nhưng điểm chuẩn chỉ kể một phần của câu chuyện.
Điều thực sự khiến Opus 4 khác biệt là sức chịu đựng của nó. Trong cuộc đua marathon thử nghiệm cuối tuần của tôi, tôi đã có nó để tái cấu trúc một dự án cá nhân - khoảng 10.000 dòng mã tài liệu kém mà tôi đã viết nhiều năm trước (tất cả chúng ta đã ở đó). Nó không chỉ hiểu được mớ hỗn độn Spaghetti mà tôi đã tạo ra, mà nó còn duy trì bối cảnh trong suốt 4 giờ, ghi nhớ các cuộc thảo luận trước đó và xây dựng các giải pháp trước đó.
Điều này phù hợp với những gì các công ty sử dụng OPUS 4 đang báo cáo. Rakuten đã chạy trong 7 giờ liên tiếp trong một dự án tái cấu trúc nguồn mở mà không mất tập trung hoặc chất lượng. Loại bền bỉ đó mở ra các khả năng cho việc giải quyết các dự án mà trước đây dường như quá phức tạp đối với sự hỗ trợ của AI.
Công nghệ dưới mui xe rất ấn tượng:
Tôi đặc biệt ấn tượng khi tôi xem nó tạo ra hệ thống riêng để theo dõi thông tin trong một nhiệm vụ phức tạp. Không cần nhắc nhở, nó bắt đầu duy trì các ghi chú có tổ chức về các quyết định chính và điểm tham chiếu - điều mà tôi muốn nhiều hơn về các cộng tác viên của con người của tôi sẽ làm!
Trong khi Opus 4 nhận được các tiêu đề, tôi thực sự thấy mình sử dụng Claude Sonnet 4 thường xuyên hơn trong quá trình thử nghiệm. Nó đạt được một điểm ngọt ngào về khả năng và chi phí làm cho nó thực tế cho việc sử dụng hàng ngày.
Đáng ngạc nhiên, Sonnet 4 hơi cạnh Opus 4 trên băng ghế Swe với số điểm 72,7%. Trong thử nghiệm trong thế giới thực của tôi, sự khác biệt về khả năng mã hóa hầu như không đáng chú ý đối với hầu hết các nhiệm vụ.
Điều làm cho Sonnet 4 hấp dẫn là khả năng tiếp cận của nó. Bây giờ đây là mô hình mặc định cho người dùng miễn phí trên các nền tảng của Claude và giá (3 triệu đô la đầu vào / mã thông báo đầu ra / triệu đô la trên một triệu đô la) giúp sử dụng thường xuyên mà không cần phá vỡ ngân hàng.
Tôi đã hỏi một người bạn tại GitHub về trải nghiệm của họ và họ xác nhận họ có kế hoạch sử dụng Sonnet 4 làm người mẫu cung cấp năng lượng cho tác nhân mã hóa mới của họ trong GitHub Copilot. Một nhà phát triển khác mà tôi biết tại một công ty khởi nghiệp có tên Igent nói với tôi rằng họ đã thấy các lỗi điều hướng trong các cơ sở mã phức tạp giảm "từ khoảng 20% xuống thực tế bằng không" sau khi chuyển sang Sonnet 4.
Để cung cấp cho bạn cảm giác tốt hơn về cách Sonnet 4 so sánh với các lựa chọn thay thế, tôi đã kết hợp sự so sánh này dựa trên nghiên cứu và thử nghiệm của tôi:
Tính năng | Claude Sonnet 4 | GPT-4.1 | Song Tử 2.5 Pro | Claude Sonnet 3.7 |
Điểm số Swees | 72,70% | 69,10% | 63,20% | 60,70% |
Cửa sổ bối cảnh | 200.000 mã thông báo | 128.000 mã thông báo | 150.000 mã thông báo | 100.000 mã thông báo |
Mã thông báo đầu ra | 64.000 | 32.000 | 32.000 | 32.000 |
Sử dụng công cụ | Song song | Tuần tự | Tuần tự | Giới hạn |
Quản lý bộ nhớ | Trình độ cao | Nền tảng | Vừa phải | Không có |
Giá đầu vào | 3 triệu đô la/triệu mã thông báo | 5 triệu đô la/triệu mã thông báo | 3,5 đô la/triệu mã thông báo | 3 triệu đô la/triệu mã thông báo |
Giá đầu ra | $ 15/triệu mã thông báo | $ 15/triệu mã thông báo | $ 14/triệu mã thông báo | $ 15/triệu mã thông báo |
Khi bạn nhìn vào các con số, Sonnet 4 cung cấp đề xuất giá trị tốt nhất mà tôi đã thấy trong cảnh quan AI hiện tại - hiệu suất tốt hơn ở mức giá thấp hơn so với đối thủ.
Ngoài các thông số kỹ thuật, có một số tính năng thực sự hữu ích trong Claude 4 đã thay đổi cách tôi làm việc với AI. Dưới đây là những người tạo ra sự khác biệt lớn nhất trong thử nghiệm của tôi:
Cả hai mô hình Claude 4 hiện có thể sử dụng các công cụ như tìm kiếm web trong quá trình suy nghĩ của chúng. Đây là một người thay đổi trò chơi cho thông tin cập nhật.
Ví dụ, khi tôi hỏi về những phát triển gần đây trong điện toán lượng tử, Claude đã nhận ra các giới hạn của dữ liệu đào tạo của nó (cắt đứt vào tháng 3 năm 2025), tìm kiếm thông tin hiện tại và kết hợp nó thành một phản hồi toàn diện. Quá trình cảm thấy tự nhiên - như xem ai đó nhận ra họ cần phải tìm kiếm thứ gì đó, sau đó tích hợp thông tin mới một cách liền mạch vào cuộc trò chuyện.
Claude 4 hiện có thể sử dụng nhiều công cụ cùng một lúc, hiệu quả hơn so với cách tiếp cận tuần tự của các hệ thống AI khác.
Tôi đã thử nghiệm điều này bằng cách yêu cầu nó phân tích một bộ dữ liệu đồng thời nghiên cứu xu hướng thị trường và tạo mã trực quan. Thay vì xử lý các nhiệm vụ này lần lượt, nó đã làm hỏng chúng song song - giống như cách một con người có thể có nhiều tab trình duyệt mở trong khi làm việc trong một dự án phức tạp.
Một người bạn phát triển tại SourceGraph nói với tôi rằng họ đã thực hiện khả năng này trong quy trình xem xét mã của họ, cho phép Claude đồng thời kiểm tra chất lượng mã, lỗ hổng bảo mật và tuân thủ hướng dẫn kiểu. Họ đã cắt giảm thời gian đánh giá 65% trong khi nắm bắt thêm 40% các vấn đề tiềm ẩn.
Việc quản lý bộ nhớ trong Claude 4 là ấn tượng hợp pháp. Khi được cấp quyền truy cập vào các tệp cục bộ, nó sẽ tạo và duy trì "tệp bộ nhớ" của riêng mình để theo dõi thông tin quan trọng trên các phiên.
Tôi đã thử nghiệm điều này bằng cách để Claude giúp tôi lên kế hoạch cho một dự án cải tạo nhà phức tạp trong vài ngày. Không cần nhắc nhở, nó đã tạo ra một tài liệu có cấu trúc theo dõi các ràng buộc ngân sách, lựa chọn vật liệu, khuyến nghị của nhà thầu và các tùy chọn thiết kế từ các cuộc hội thoại trước đây của chúng tôi. Khi tôi trở lại vài ngày sau đó, nó đã nhặt được ngay khi chúng tôi rời đi mà không bỏ lỡ một nhịp nào.
Tính năng này có các ứng dụng kinh doanh thực tế quá. Một người bạn làm việc tại một công ty dịch vụ tài chính đã sử dụng nó cho một dự án tuân thủ quy định, trong đó Claude duy trì nhận thức về việc thay đổi các yêu cầu và phiên bản tài liệu trong một dự án sáu tháng với nhiều bên liên quan.
Hãy nói chuyện tiền. Nhân học đã tiếp tục định giá phù hợp với các mô hình trước đó:
Về mặt thực tế, một ngày làm việc điển hình của việc sử dụng nặng với Sonnet 4 có thể tiêu tốn của tôi 2-5 đô la, trong khi việc sử dụng tương tự với OPUS 4 sẽ vào khoảng 10-25 đô la. Đối với hầu hết các nhu cầu của tôi, Sonnet 4 đạt điểm ngọt ngào của khả năng và chi phí.
Cả hai mô hình đều có sẵn thông qua nhiều nền tảng - API Anthropic, Amazon Bedrock và Google Cloud's Vertex AI - vì vậy bạn có thể sử dụng bất kỳ cơ sở hạ tầng nào phù hợp với cơ sở hạ tầng hiện tại của mình.
Nếu bạn lo lắng về chi phí cộng lại, đây là một số thủ thuật tôi đã tìm thấy để kiểm soát chi phí:
Một công ty truyền thông tôi đã tham khảo ý kiến cho các chiến lược này và cắt giảm 70% chi phí AI của họ trong khi vẫn duy trì chất lượng đầu ra.
Là một nhà phát triển bán thời gian, tôi đặc biệt hào hứng để thử Claude Code, hiện thường có sẵn. Nó mang đến khả năng của Claude trực tiếp vào quy trình phát triển của bạn - trong thiết bị đầu cuối, IDE của bạn và thậm chí chạy ở chế độ nền.
Các phần mở rộng beta mới cho mã VS và JetBrains được đánh bóng đáng ngạc nhiên. Điều tôi yêu thích là cách các chỉnh sửa được đề xuất của Claude xuất hiện nội tuyến trong các tệp của bạn - không còn sao chép và dán giữa các cửa sổ. Cảm giác như lập trình cặp với một nhà phát triển cao cấp luôn sẵn sàng.
Ngoài ra còn có một SDK mã Claude mới cho phép bạn xây dựng các tác nhân tùy chỉnh bằng công nghệ cốt lõi tương tự. Tôi không có thời gian để lặn sâu ở đây, nhưng khả năng rất hấp dẫn.
Một ví dụ thú vị là mã Claude trên GitHub (beta), bạn có thể gắn thẻ các yêu cầu kéo để tự động trả lời phản hồi của người đánh giá hoặc sửa lỗi CI. Một người bạn đã thử nghiệm tính năng này nói với tôi rằng nó đã cắt giảm thời gian giải quyết PR của họ.
Đây là một vấn đề tôi gặp phải: Tôi muốn nhóm nhỏ của mình sử dụng Claude 4, nhưng tôi không muốn trả tiền cho nhiều tài khoản hoặc chia sẻ mật khẩu của mình (điều này sẽ vi phạm các điều khoản dịch vụ và tạo rủi ro bảo mật).
Đó là khi tôi phát hiện ra Trình duyệt Anteretect DiCloak - một giải pháp thông minh để chia sẻ tài khoản AI một cách an toàn . Nó sử dụng thông tin đăng nhập dựa trên cookie để xác thực người dùng mà không tiết lộ thông tin đăng nhập thực tế của bạn, giữ mọi thứ ổn định và an toàn.
Sau khi sử dụng nó trong một vài tuần, tôi ấn tượng với cách nó hoạt động tốt. Đây là những gì làm cho nó trở nên đặc biệt:
Khi chia sẻ quyền truy cập AI của Claude với các thành viên trong nhóm, trình duyệt Antidetect của DiCloak cung cấp một số tính năng bảo mật chính:
Chia sẻ Claude AI thông qua Trình duyệt Anteretect DiCloak có một số lợi ích thực tế:
Chỉ cần bắt đầu từ $ 8 mỗi tháng, trình duyệt Anteretect DiCloak là một trong những khoản đầu tư năng suất tốt nhất của chúng tôi. Nó cho phép chúng tôi mở rộng Claude AI trên toàn bộ nhóm của chúng tôi mà không bị đau đầu bảo mật hoặc căng thẳng ngân sách của nhiều tài khoản.
Ngoài các thông số kỹ thuật và tính năng, những gì quan trọng là kết quả. Đây là những gì tôi đã thấy và nghe từ các đội sử dụng Claude 4:
Đây không chỉ là các tuyên bố tiếp thị - chúng là kết quả từ các nhóm thực sự mà tôi đã nói chuyện với những người đã tích hợp Claude 4 vào quy trình làm việc của họ.
Tôi đã tiếp cận với một số bạn bè và đồng nghiệp sử dụng Claude 4 để có được ý kiến không được lọc của họ. Đây là những gì họ nói với tôi:
Sau khi dành thời gian đáng kể với cả hai mô hình, đây là cách tôi có thể phù hợp với các nhu cầu khác nhau:
Đối với hầu hết người dùng và nhóm, tôi thành thật nghĩ rằng Sonnet 4 đạt điểm ngọt ngào. Khoảng cách hiệu suất với OPUS 4 là tối thiểu cho hầu hết các nhiệm vụ hàng ngày và chênh lệch giá là đáng kể.
Sau khi dành thời gian với Claude 4, tôi tin rằng chúng ta đang bước vào giai đoạn phát triển AI mới - một nơi mà các hệ thống này trở thành cộng tác viên thực sự thay vì chỉ là công cụ.
Khả năng duy trì ngữ cảnh qua các phiên mở rộng, ghi nhớ các chi tiết quan trọng và lý do thông qua các vấn đề phức tạp từng bước thay đổi về cơ bản về cách chúng ta có thể làm việc với AI. Đó không chỉ là về việc nhận được câu trả lời nữa - mà là về việc có một đối tác suy nghĩ giúp nâng cao khả năng của bạn.
Bằng cách kết hợp các tính năng nâng cao của Claude 4 với các khả năng chia sẻ an toàn của trình duyệt DiCloak, các nhóm thuộc mọi quy mô giờ đây có thể truy cập AI tiên tiến mà không phá vỡ ngân hàng. Dân chủ hóa các công cụ AI mạnh mẽ này có thể sẽ đẩy nhanh sự đổi mới trong các ngành công nghiệp.
Cho dù bạn là một nhà phát triển đang tìm cách hợp lý hóa quy trình công việc mã hóa của mình, một người tạo nội dung tìm kiếm hỗ trợ nghiên cứu và viết, hoặc một trưởng nhóm muốn cung cấp các công cụ AI cho toàn bộ tổ chức của bạn, Claude 4 và Dicloak Anteretect Trình duyệt cung cấp một sự kết hợp mạnh mẽ đang thay đổi cách chúng tôi làm việc.
Tôi rất muốn nghe về những trải nghiệm của bạn nếu bạn quyết định thử họ!