Trong Mùi Đu Đủ Xanh của đạo diễn Trần Anh Hùng, có một cô bé tên Mùi. Mùi gọt đu đủ, lau sàn, rót trà. Mỗi động tác chính xác đến mức cả căn nhà quên mất cô đang ở đó. Không ai khen, không ai nhắc, không ai nghĩ rằng mình đang được phục vụ. Công việc hoàn hảo nhất là công việc biến mất khỏi ý thức người thụ hưởng.
Ba mươi năm sau, ngành công nghệ doanh nghiệp đang phát hiện ra điều tương tự, bằng cách tốn rất nhiều tiền.
Cái trần 30%

Vasuman đặt ra một con số đáng chú ý: tỷ lệ nhân viên thực sự sử dụng AI trong doanh nghiệp dao động khoảng 25 đến 30 phần trăm. Dữ liệu từ nhiều nguồn xác nhận xu hướng này. Theo nghiên cứu của Kore.ai năm 2025, chỉ khoảng 30% doanh nghiệp sẵn sàng mở rộng AI ra toàn tổ chức. McKinsey ghi nhận chưa đến 40% doanh nghiệp thấy tác động tài chính có ý nghĩa từ AI ở cấp độ toàn công ty.
Bạn có thể đổ lỗi cho công nghệ. Nhưng công nghệ không phải vấn đề.
Vấn đề nằm ở hành vi. Một nhân viên kế toán đã dùng Excel và NetSuite suốt mười hai năm sẽ không tự dưng chuyển sang một nền tảng AI mới chỉ vì sếp bảo. Thói quen nghề nghiệp hình thành qua hàng ngàn lần lặp lại, cứng như bê tông. Không phải vì người ta lười. Vì bộ não con người được thiết kế để tiết kiệm năng lượng bằng cách tự động hóa hành vi quen thuộc. Tâm lý học gọi đó là “vòng lặp thói quen” (habit loop), một cơ chế sinh tồn đã tồn tại hàng trăm nghìn năm trước khi ai đó nghĩ ra chatbot.
Và đây là chỗ phần lớn doanh nghiệp mắc kẹt.
Bán demo hay bán kết quả

Có một mô hình kinh doanh mà ngành phần mềm doanh nghiệp đã chạy suốt hai mươi năm: bán giao diện. CRM có giao diện. ERP có giao diện. Phần mềm quản lý dự án có giao diện. Trong kỷ nguyên SaaS, giao diện chính là sản phẩm.
Rồi AI đến. Và ngành mang theo đúng khuôn mẫu cũ: xây một giao diện mới, gắn nhãn “AI-powered”, đưa cho nhân viên, rồi hy vọng họ dùng.
Mình gọi đây là “bán demo” (demo as a service). Sản phẩm trông ấn tượng trong buổi trình diễn. CEO gật gù. Hợp đồng ký xong. Sáu tháng sau, phần lớn nhân viên chưa đăng nhập lần nào.
Cái mà Vasuman đề xuất là một sự đảo ngược hoàn toàn. Thay vì đưa cho nhân viên một công cụ AI để họ tự tìm cách dùng, hãy nhúng AI trực tiếp vào hệ thống họ đang dùng hàng ngày. Nếu quy trình thanh toán chạy trên NetSuite, xây agent trên NetSuite. Nếu bán hàng sống trong Salesforce, đặt agent vào Salesforce. Agent đọc dữ liệu từ hệ thống mà công ty đã tin tưởng, thực thi trong quy trình mà đội ngũ đang dùng, và ghi kết quả trở lại nguồn dữ liệu gốc.
Nhân viên không cần học nền tảng mới. Không cần quản lý bầy agent. Không cần thay đổi thói quen mười hai năm. Công việc cứ thế được làm xong. Đây là “bán kết quả” (outcomes as a service), phiên bản doanh nghiệp của việc gọt đu đủ xanh.
Hóa đơn nhà dân tộc học
Nhưng đến đây câu chuyện bắt đầu phức tạp.
Vasuman thừa nhận một điều mà ít công ty AI muốn nói thẳng: mỗi doanh nghiệp vận hành khác nhau, và sự khác biệt đó chỉ nắm bắt được khi cử kỹ sư đến ngồi tại chỗ hàng tuần. Ông gọi họ là “kỹ sư triển khai tại hiện trường” (forward deployed engineers). Công việc của họ không phải viết code. Công việc của họ là ngồi cạnh nhân viên kế toán, quan sát cách người ta thực sự làm, và ghi lại những quy trình không có trong bất kỳ tài liệu nào.
Nghe quen không? Đây là phương pháp dân tộc học (ethnography), một nhánh của nhân học dùng quan sát tham dự để hiểu hành vi thực tế thay vì hành vi được khai báo. Nhà nhân học Bronisław Malinowski đã làm điều tương tự ở quần đảo Trobriand hơn một trăm năm trước, chỉ khác là ông nghiên cứu nghi lễ trao đổi vòng Kula thay vì quy trình đối soát hóa đơn.
Và đây là nơi cần đặt câu hỏi nghiêm túc.

Vasuman lập luận rằng quy trình vận hành hậu cần của mỗi công ty “cực kỳ khác nhau”, nên không thể dùng sản phẩm đóng gói, phải dùng dịch vụ theo từng khách hàng. Nhưng lập luận này có thật sự phản ánh thực tế, hay nó phản ánh mô hình kinh doanh mà ông đang bán?
Nếu nhìn vào quy trình thanh toán (accounts payable) của hầu hết doanh nghiệp, bộ khung gần như giống nhau: nhận hóa đơn, đối chiếu đơn hàng, phê duyệt, thanh toán. Cái khác nhau nằm ở ngoại lệ. Khi hóa đơn không khớp đơn hàng, khi chính sách nội bộ yêu cầu phê duyệt ba cấp cho khoản trên năm mươi triệu, khi có một spreadsheet không chính thức mà chỉ chị Lan phòng kế toán biết. Hai mươi phần trăm khác biệt đó là nơi tám mươi phần trăm lỗi và ngoại lệ sống.
Vậy câu hỏi trung thực hơn: sự khác biệt giữa các doanh nghiệp nằm ở quy trình hay nằm ở cách quy trình hỏng? Nếu câu trả lời là cách hỏng, thì cái cần ghi chép tại hiện trường không phải quy trình, mà là cách hỏng (failure mode). Và cách hỏng có thể phân loại, hệ thống hóa, thậm chí dự đoán, nhanh hơn nhiều so với việc dựng lại toàn bộ quy trình từ đầu.
Nghịch lý nhìn thấy

Giả sử mô hình này hoạt động. Agent chạy ngầm, nhân viên không thấy, công việc tự xong. Nghe đẹp. Nhưng đến kỳ gia hạn hợp đồng, ai chứng minh rằng agent đã tạo ra giá trị?
Khi lỗi đối soát giảm đáng kể, đó là nhờ agent, nhờ người quản lý quy trình đã tinh chỉnh cấu hình, hay nhờ chính sách mới mà phòng tài chính ban hành trùng thời điểm? AI vô hình tạo ra một bài toán quy kết (attribution problem) mà bất kỳ ai làm marketing đều nhận ra: càng tích hợp sâu, càng khó tách biệt hiệu quả của từng thành phần.
Nhà cung cấp phải thiết kế tính minh bạch ngược (legibility). Làm cho cái vô hình đủ nhìn thấy để giữ hợp đồng, nhưng không nhìn thấy đến mức yêu cầu nhân viên phải tương tác. Đây là một bài toán kỹ thuật lẫn tâm lý, và nó chưa được giải đến nơi.
Đôi tay không khuôn mặt
Đạo diễn Trần Anh Hùng không bao giờ trả lời câu hỏi mà bộ phim đặt ra: sự phục vụ hoàn hảo đến mức vô hình là tự do hay là phục tùng tuyệt đối? Camera của ông hay zoom vào đôi tay Mùi, gọt đu đủ, xếp trái cây, pha trà. Hiếm khi zoom vào khuôn mặt. Người xem thấy kết quả của công việc, thấy sự chính xác của từng động tác, nhưng không thấy người đang làm. Trần Anh Hùng biến cô bé giúp việc thành một câu hỏi kéo dài suốt chín mươi phút: lao động thực hiện với sự chú tâm thuần khiết có phân biệt được với nghệ thuật không?
Và nếu không phân biệt được, ai bảo vệ người nghệ sĩ?

Mô hình “bán kết quả” đúng về mặt kỹ thuật. Nhúng agent vào hệ thống hiện có, bỏ qua rào cản thói quen, giao luôn đầu ra thay vì đưa công cụ. Logic sắc bén. Nhưng logic sắc bén cần một tầng kiểm soát phía trên: ai đang nhìn vào agent, agent đang nhìn vào đâu, và lúc nào nó dừng lại để hỏi con người?
Vasuman gọi tầng đó là “mặt phẳng điều khiển” (control plane), giao diện duy nhất trong một hệ thống được thiết kế để có ít giao diện nhất có thể. Một người quản lý quy trình, không phải bốn mươi nghìn nhân viên, có quyền tạm dừng, thay đổi quyền, hoặc rút agent về. Agent, trong mỗi lần chạy, phải tự hỏi: bước này có cần con người không? Nếu có, thông báo đúng chỗ con người đang ở, qua email hoặc Slack, không phải qua một nền tảng mới.
Thiết kế đó tách biệt “bán kết quả” khỏi “bán demo”. Demo giao đồ chơi rồi hy vọng. Kết quả giao sản phẩm hoàn chỉnh rồi giám sát. Sự khác biệt nghe nhỏ. Nó quyết định mọi thứ.
Trần Anh Hùng zoom vào đôi tay gọt đu đủ, không bao giờ hỏi Mùi nghĩ gì. Agent cũng chẳng ai hỏi. Nhưng ít nhất, nên có ai đó đang nhìn vào màn hình điều khiển.
