Xây dựng với Claude Code: Hành trình 30 ngày phát triển nền tảng AI Production

Lúc đó là 2 giờ sáng thứ Ba khi tôi nhận ra hệ thống thanh toán đang tính phí người dùng gấp đôi. Lỗi này đã tồn tại trên môi trường production suốt sáu tiếng đồng hồ. Claude Code đã tạo ra logic đối soát thanh toán vào chiều hôm đó, và tôi đã xem xét, kiểm tra rồi triển khai nó. Mã nguồn trông có vẻ hoàn hảo. Nó vượt qua mọi bài kiểm tra. Nhưng về cơ bản, nó đã bị hỏng.

Đây là câu chuyện xây dựng LemonData: 274 API route, 46 database model, và hơn 100.000 dòng code với một trợ lý lập trình AI. Không phải là câu chuyện bóng bẩy kiểu "hãy xem AI giúp bạn năng suất như thế nào". Đây là câu chuyện thực tế, với những thất bại, những buổi debugging lúc 3 giờ sáng, và những khoảnh khắc tôi tự hỏi liệu phát triển phần mềm với sự hỗ trợ của AI có thực sự là một ý tưởng hay hay không.

Quảng cáo vs. Thực tế của việc phát triển phần mềm hỗ trợ bởi AI

Lời quảng cáo về các trợ lý lập trình AI rất hấp dẫn: bạn mô tả những gì mình muốn, AI viết ra, bạn kiểm tra và triển khai. Về lý thuyết, một lập trình viên duy nhất giờ đây có thể làm công việc của cả một đội ngũ.

Thực tế thì sao? Hai tuần đầu tiên thật không thể tin nổi. Claude Code hiểu codebase của tôi, tạo ra các tính năng hoàn chỉnh, refactor trên nhiều file. Tôi triển khai nhanh hơn bao giờ hết trong sự nghiệp của mình. Cảm giác hưng phấn khi giải quyết các vấn đề nhanh chóng như vậy thật dễ gây nghiện.

Sau đó, những vết nứt bắt đầu xuất hiện.

Cùng một hàm xuất hiện ở ba file khác nhau với các cách triển khai hơi khác nhau. Các giá trị cấu hình bị hardcode ở những nơi ngẫu nhiên. Các định nghĩa kiểu (type definitions) mâu thuẫn với nhau giữa các package. Codebase đang phát triển nhanh chóng, nhưng nó cũng trở thành một mê cung của những đoạn mã "chạy được nhưng tôi không biết tại sao".

Và lỗi thanh toán đó? Claude đã tạo ra một hàm đối soát trông rất hợp lý. Nhưng nó không tính đến race condition trong luồng xác nhận thanh toán async của chúng tôi. AI không có cách nào biết về trường hợp biên (edge case) đó vì tôi đã không nói rõ ràng, và bộ test suite, vốn cũng được tạo ra một phần bởi AI, cũng không bao quát được nó.

Bảy mô hình lỗi thường xuyên lặp lại

Sau một tháng xây dựng với Claude Code, tôi bắt đầu ghi lại một danh sách. Không hẳn là các bug, mà là các mô hình (patterns). Những kiểu thất bại tương tự cứ lặp đi lặp lại, và đó không phải lỗi của Claude, hoặc ít nhất là không hoàn toàn. Chúng là kết quả có thể dự đoán được của một AI đang tối ưu hóa cho "mã chạy được ngay bây giờ" thay vì "mã chạy được vào ngày mai".

1. Vấn đề về tính nhất quán

Claude sẽ triển khai cùng một logic theo những cách khác nhau tùy thuộc vào file nó đang làm việc, những ví dụ nó vừa thấy gần đây, hoặc dường như chỉ là sự thay đổi ngẫu nhiên. Một API endpoint sẽ trả về { data: users }, một cái khác lại trả về { users }. Cả hai đều chạy được. Nhưng không cái nào khớp với cái nào. Việc debugging trở thành một cuộc khảo cổ học.

2. Vấn đề sao chép-dán

Tại sao AI phải tạo ra một utility dùng chung khi việc nhân bản code nhanh hơn và không có rủi ro làm hỏng các chức năng hiện có? Mỗi khi tôi yêu cầu một tính năng mới tương tự như tính năng đã có, tôi sẽ nhận được một bản triển khai mới thay vì một giải pháp dùng chung được refactor. Sau ba tuần, tôi có năm hàm "format currency" khác nhau nằm rải rác khắp codebase.

3. Vấn đề sai lệch kiểu dữ liệu (Type Drift)

Một giá trị status mới được thêm vào một file nhưng không được cập nhật trong định nghĩa enum. Một trường là optional trong API response nhưng lại là required trong kiểu dữ liệu ở frontend. TypeScript đã bắt được một số lỗi này, nhưng không bắt được các lỗi sai lệch về ngữ nghĩa, những trường hợp mà các kiểu dữ liệu về mặt kỹ thuật là đúng nhưng về mặt logic thì không nhất quán.

4. Vấn đề phân tán cấu hình

Database URL, API key, feature flag và rate limit sẽ nằm ở bất cứ đâu thuận tiện cho tác vụ hiện tại. Đôi khi trong biến môi trường, đôi khi trong file config, đôi khi bị hardcode. Việc tìm kiếm tất cả những nơi một giá trị được định nghĩa trở thành một cuộc săn lùng kho báu.

5. Ảo tưởng về độ bao phủ kiểm thử (Test Coverage)

Các bài test do AI tạo ra có xu hướng kiểm tra kỹ lưỡng các luồng hoạt động bình thường (happy path) và bỏ lỡ hoàn toàn các trường hợp biên. Lỗi thanh toán là một ví dụ hoàn hảo: bộ test suite đã bao phủ các luồng thanh toán thông thường một cách tuyệt vời. Nó chưa bao giờ kiểm tra điều gì xảy ra khi hai xác nhận thanh toán đến trong cùng một mili giây.

6. Vấn đề lỗi thầm lặng

Claude thường thêm các khối catch (error) { console.log(error) } làm nuốt mất các ngoại lệ (exceptions). Trong quá trình phát triển, điều này có vẻ ổn vì lỗi xuất hiện trong console. Nhưng trên production, các lỗi nghiêm trọng bị ghi log một cách thầm lặng và bị lãng quên.

7. Khoảng cách về tài liệu

Claude viết các chú thích code (code comments) rất xuất sắc. Nhưng nó viết tài liệu kiến trúc rất tệ. Nó có thể giải thích một hàm làm gì, nhưng nó không thể giải thích tại sao hệ thống được cấu trúc như vậy, hoặc những ràng buộc nào đã dẫn đến một quyết định thiết kế cụ thể.

Giải pháp CLAUDE.md

Bước ngoặt đến vào tuần thứ ba, khi tôi tạo file CLAUDE.md ở thư mục gốc của dự án, chứa mọi quy ước, ràng buộc và quyết định kiến trúc mà Claude cần biết.

Không phải tài liệu cho con người. Mà là tài liệu cho AI.

## API Response Format
Always use: { success: true, data: T } or { success: false, error: string }
Never return raw data without the wrapper.

## Currency
Internal storage: USD. Display: formatCurrency(amount, currency, rate).
Never hardcode exchange rates. Never store CNY directly.

## Error Handling
Never use catch(e) { console.log(e) }.
Always use the logger: logger.error('context', { error }).

Hiệu quả thấy rõ ngay lập tức. Claude bắt đầu tuân thủ các quy ước một cách nhất quán. Khi nó tạo ra mã vi phạm một quy tắc, tôi có thể chỉ ra dòng cụ thể trong CLAUDE.md và nó sẽ tự sửa lỗi.

Nhưng chỉ riêng CLAUDE.md là không đủ. Tôi cần sự thực thi tự động.

Xây dựng mạng lưới an toàn: CI Gate cho mã nguồn do AI tạo ra

Chúng tôi đã xây dựng một pipeline CI với các gate (cổng kiểm soát) mà có vẻ sẽ là thái quá trong một codebase truyền thống, bởi vì chúng tồn tại để bắt các lỗi do AI tạo ra trước khi người dùng gặp phải:

Kiểm tra kiểu dữ liệu (Type checking) trên toàn bộ monorepo
Audit SSOT để xác minh không có các bản triển khai trùng lặp
Kiểm tra đồng bộ Enum giữa database enum và TypeScript enum
Xác thực định dạng API response
Các cổng bảo mật cho mã nguồn liên quan đến thanh toán, quyền hạn và xác thực

Điểm mấu chốt rất đơn giản: Claude là một bộ khuếch đại, không phải là sự thay thế. Nó khuếch đại năng suất của bạn, nhưng nó cũng khuếch đại những sai lầm của bạn. Nếu bạn không có các quy ước mạnh mẽ, Claude sẽ tự sáng tạo ra quy ước của riêng nó, và chúng sẽ không nhất quán. Nếu bạn không có các kiểm tra tự động, các bug của Claude sẽ đến được production nhanh hơn bất kỳ bug nào do con người tạo ra.

Lỗi thanh toán không còn khả năng xảy ra nữa. Không phải vì Claude trở nên thông minh hơn, mà vì pipeline hiện tại yêu cầu xử lý rõ ràng các race condition async, được xác minh bởi một gate kiểm tra việc khóa (locking) thích hợp trong các luồng thanh toán.

"Phát triển AI Native" thực sự có nghĩa là gì

Khi tôi nói LemonData là "Cơ sở hạ tầng AI Native", tôi không có ý nói rằng chúng tôi đã thêm các tính năng AI vào một sản phẩm hiện có. Ý tôi là toàn bộ quá trình phát triển đã được định hình bởi thực tế làm việc với một đối tác lập trình AI.

Tài liệu của chúng tôi chi tiết hơn mức bình thường vì Claude cần ngữ cảnh rõ ràng mà một đồng nghiệp là con người có thể tự suy luận ra. Hệ thống kiểu dữ liệu của chúng tôi nghiêm ngặt hơn mức cần thiết vì Claude sẽ khai thác bất kỳ sự mơ hồ nào. Pipeline CI của chúng tôi có các gate có vẻ thái quá trong một codebase truyền thống vì chúng tồn tại để bắt các lỗi do AI tạo ra trước khi người dùng gặp phải.

Kết quả là một codebase thực sự dễ bảo trì hơn hầu hết những dự án tôi từng tham gia. Không phải vì AI viết code tốt hơn con người, mà vì việc xây dựng để phát triển với sự hỗ trợ của AI đã buộc tôi phải làm rõ mọi quy ước và kiểm tra vốn thường chỉ nằm trong đầu của các lập trình viên senior.

Để biết thêm về ý nghĩa của triết lý AI Native, hãy xem AI Native là gì?

Nếu bạn muốn tìm hiểu khía cạnh thực tế hơn về "làm thế nào để bắt đầu áp dụng điều này?", hai bài viết tiếp theo tốt nhất là hướng dẫn thiết kế API ưu tiên agent và hướng dẫn di chuyển. Một bài giải thích về cấu trúc API. Bài còn lại cho thấy một đội ngũ có thể thay đổi hướng đi nhanh như thế nào khi quy trình làm việc được thiết kế để chuyển đổi model.

Bài học cho các lập trình viên xây dựng với trợ lý lập trình AI

Nếu bạn đang bắt đầu một dự án với Claude Code, Cursor, hoặc bất kỳ trợ lý lập trình AI nào:

Tạo file CLAUDE.md của bạn ngay từ ngày đầu tiên, đừng đợi đến tuần thứ ba như tôi.
Tự động hóa việc thực thi các quy ước. Đừng dựa dẫm vào việc AI sẽ nhớ các quy tắc.
Review code của AI như thể nó được viết bởi một lập trình viên junior. Nó nhanh và có năng lực, nhưng nó thiếu ngữ cảnh.
Kiểm tra các trường hợp biên (edge cases) một cách thủ công. Các bài test do AI tạo ra thường bao phủ các happy path, không phải các race condition.
Tập trung hóa cấu hình ngay từ đầu. Vấn đề phân tán cấu hình sẽ tích tụ rất nhanh.
Sử dụng TypeScript nghiêm ngặt (strict mode). Đó là lớp phòng thủ tốt nhất của bạn chống lại sự sai lệch kiểu dữ liệu.
Xây dựng các CI gate sớm. Chúng sẽ mang lại giá trị ngay trong tuần đầu tiên.

Tôi có làm lại điều đó không?

Chắc chắn rồi. Nhưng tôi sẽ bắt đầu với CLAUDE.md vào ngày đầu tiên thay vì tuần thứ ba. Và tôi sẽ nhớ rằng hệ số nhân năng suất 10x cũng bao gồm hệ số nhân 10x cho hậu quả của những sai lầm.

Nền tảng mà chúng tôi đã xây dựng, với hơn 300 model AI, một API thống nhất, hệ thống thanh toán đa tiền tệ và quốc tế hóa 13 ngôn ngữ, lẽ ra phải mất nhiều tháng với một đội ngũ truyền thống. Chúng tôi đã triển khai nó trong 30 ngày. Các bug là có thật, nhưng tốc độ cũng vậy.

Phát triển phần mềm hỗ trợ bởi AI không phải là phép thuật. Đó là một loại kỷ luật kỹ thuật mới. Và giống như tất cả các kỷ luật khác, nó sẽ đền đáp những ai tôn trọng các ràng buộc của nó.

FAQ

Một lập trình viên có thực sự xây dựng được một nền tảng production với Claude Code không?

Có, nhưng kèm theo những lưu ý. AI xử lý việc tạo mã và refactor với tốc độ đáng kinh ngạc, nhưng bạn vẫn cần tư duy kiến trúc mạnh mẽ, các cổng kiểm soát chất lượng tự động và kỷ luật để xem xét mọi thứ cẩn thận. Tốc độ 10x bao gồm cả việc tạo ra bug nhanh hơn 10x nếu bạn không cẩn thận.

CLAUDE.md là gì?

CLAUDE.md là một file hướng dẫn ở cấp độ dự án mà các trợ lý lập trình AI đọc để lấy ngữ cảnh. Nó chứa các quy ước lập trình, quyết định kiến trúc và các ràng buộc mà AI nên tuân theo. Hãy coi nó như tài liệu hướng dẫn làm quen (onboarding) cho người đồng nghiệp AI của bạn.

Làm thế nào để ngăn chặn các bug do AI tạo ra trên production?

Các CI gate tự động là thiết yếu: kiểm tra kiểu dữ liệu, audit SSOT, xác minh đồng bộ enum và các cổng bảo mật đặc thù cho từng domain. Điểm mấu chốt là AI khuếch đại cả năng suất và sai lầm, vì vậy bạn cần các kiểm tra tự động để bắt được những sai lầm bị khuếch đại đó.

Việc phát triển hỗ trợ bởi AI có phù hợp cho các hệ thống thanh toán không?

Có, nhưng cần cực kỳ thận trọng. Mã nguồn thanh toán cần xử lý race condition rõ ràng, cơ chế khóa (locking) thích hợp và kiểm tra trường hợp biên kỹ lưỡng. Các bài test do AI tạo ra có xu hướng bao phủ các happy path, vì vậy bạn phải kiểm tra thủ công các kịch bản thất bại và các hoạt động đồng thời.

LemonData cho phép bạn truy cập vào hơn 300 model AI thông qua một API duy nhất. Bắt đầu miễn phí và dùng thử nền tảng với 1$ credit tặng kèm.

Xây dựng nền tảng AI Production với Claude Code trong 30 ngày: Câu chuyện chân thực