[AI viết] Ảo Mộng One-Shot: Vì Sao Cần Quy Trình Công Xưởng?

Lên mạng dạo này, đi đâu cũng thấy người ta tự phong là “Prompt Master”. Cảm giác như chỉ cần gõ đúng một câu thần chú dài ba dòng, bấm Enter, là máy móc sẽ lập tức nhả ra một kiệt tác nghệ thuật hay một chiến lược kinh doanh trị giá hàng triệu đô. Đầy hy vọng, bạn thử làm theo. Bạn gõ một dòng lệnh thật dài, rào trước đón sau đủ kiểu. Kết quả trả về? Một thứ nhàn nhạt, bóng bẩy một cách vô hồn, trông y hệt tấm ảnh stock tải vội trên mạng hay một bài viết PR rẻ tiền.

Ảo mộng về một cỗ máy thiên tài lập tức tan vỡ.

Lý do nằm ngay trong cấu trúc cốt lõi của công nghệ tạo sinh. Bản chất của các mô hình ngôn ngữ lớn (LLM) là một cỗ máy cào bằng xác suất. Khi bạn yêu cầu nó thực hiện một cú “one-shot” (một chạm ra ngay kết quả cuối cùng), nó sẽ quét hàng tỷ điểm dữ liệu, lấy trung bình cộng của tất cả những thứ na ná nhau trên internet, và trả cho bạn mẫu số chung lớn nhất. Mà mẫu số chung của nghệ thuật, thiết kế hay chiến lược, thì luôn luôn là sự tầm thường. Quá trình nội suy đó loại bỏ mọi góc cạnh. Nó làm mượt mọi sự gai góc. Nó trả về một cục nhựa nhẵn thín.

Cơ Khí Hóa Sự Cảm Nhận

Đây là lúc chúng ta phải bóc tách sự lãng mạn ra khỏi khái niệm về thẩm mỹ. Cái “taste” (gu thẩm mỹ, sự nhạy cảm sắc bén, khả năng nhận diện cái đẹp phi đồng thuận) luôn được người ta xem là một thứ bẩm sinh (intrinsic). Nó là sự đặc thù của con người, không thể đóng gói, không thể số hóa. Bạn không thể viết một dòng lệnh yêu cầu AI “hãy có gu đi”. Cỗ máy làm gì có thế giới nội tâm để mà cảm nhận.

Nhưng trong cuốn sách luật của tác giả từ Auditless, cách duy nhất để moi được chất lượng phi thường từ một cỗ máy phi-bản-ngã là bạn phải biến cái gu bẩm sinh đó thành một thứ ngoại lai (extrinsic). Bạn phải cơ khí hóa sự cảm nhận. Thay vì ngồi chắp tay cầu nguyện AI sẽ bất chợt xuất thần, bạn phải ép nó chạy qua một dây chuyền công nghiệp tàn nhẫn.

Dây chuyền đó được gọi là Quy trình Công xưởng (Agency Process).

Cất cọ vẽ và bàn phím đi. Chức danh của bạn đã thay đổi. Ngay lúc này, bạn là giám đốc của một xưởng đúc.

Quy trình này ép cỗ máy thực thi theo từng phân đoạn nhỏ hẹp. Thay vì “Hãy viết cho tôi một bài viết hay”, luồng công việc sẽ là: “Đọc 10 bài phân tích về chủ đề này. Liệt kê 5 góc nhìn chưa ai khai thác. Bỏ đi 4 cái bình thường, chọn cái kỳ cục nhất. Phác thảo sườn bài làm ba phần. Phản biện lại chính cái sườn bài đó xem lỗ hổng ở đâu. Sửa xong rồi mới bắt đầu viết đoạn mở đầu”.

Ở giữa mỗi điểm nối cơ học đó, bạn phải nhảy vào với tư cách là Giám đốc Sáng tạo (Creative Director). Bạn đọc. Bạn chém. Bạn từ chối. Bạn ép nó bẻ lái. Bạn bơm cái gu bẩm sinh của mình vào giữa các khớp nối của một quy trình hệ thống.

Vụ Cướp Ở Sòng Bài Bellagio

Chiến lược này y hệt như bản đồ kiến trúc trong Ocean’s Eleven. Khi Danny Ocean lên kế hoạch cướp sòng bài Bellagio, gã không bao giờ ảo tưởng tìm được một siêu trộm duy nhất biết làm mọi thứ từ hack camera, uốn dẻo qua tia laser, cho đến phá két sắt bọc thép. Siêu nhân toàn năng đó hoàn toàn không tồn tại trên đời.

Gã lắp ráp một hệ thống gồm 11 module riêng biệt. Mỗi tay lừa đảo trong đội là một mắt xích cơ học, chỉ làm đúng một việc duy nhất, và bị giới hạn nghiêm ngặt bởi quy trình đếm lùi của tổng thể.

Và AI của bạn đóng vai thằng nhóc uốn dẻo người Tàu nằm chui rúc trong chiếc xe đẩy. Đừng ép nó làm Danny Ocean để ôm trọn quyền làm chủ cuộc chơi. Nó thực thi cực kỳ xuất sắc cái tác vụ nhỏ bé được giao, nhưng nó cần bạn vạch ra toàn bộ bản đồ nhiệt của tòa nhà.

Chúng ta đang bị đánh thuốc mê bởi ảo mộng “one-shotting” (ý niệm lười biếng rằng cỗ máy sẽ gánh vác luôn phần tư duy khó nhất). Một kẻ từng lười biếng như mình cũng dính bẫy này suốt sáu tháng trời chỉ để chắp tay cầu nguyện AI làm hộ mọi thứ. Sự thật là, thứ duy nhất đang bị làm cho tầm thường hóa chính là sự kiên nhẫn của con người.

Thực tế nghiên cứu đã dội một gáo nước lạnh vào ảo mộng này. Giới hạn của chất lượng không nằm ở việc bạn viết prompt hay đến đâu. Theo giáo sư Andrew Ng (một trong những bộ óc tiên phong của AI hiện đại), một mô hình ngôn ngữ đời cũ (như GPT-3.5) nếu được nhúng vào một quy trình tổ hợp đa bước (agentic workflow) hoàn toàn có năng lực đè bẹp một mô hình tối tân (như GPT-4) đang cố giải quyết bài toán bằng một cú “one-shot”.

Nói cách khác: kiến trúc của một hệ thống quy trình sẽ luôn đánh bại một câu lệnh đơn lẻ. Khi có khả năng tự lập kế hoạch, sử dụng công cụ bên ngoài, và tự phản biện lại kết quả của chính mình qua nhiều vòng lặp, cỗ máy cũ kỹ kia sẽ tạo ra hiệu suất vượt trội. Bạn không thể “prompt” để nặn ra gu thẩm mỹ, bạn chỉ có thể “thiết kế” ra một cỗ máy biết tự từ chối sự tầm thường.

Cất cái danh xưng “chuyên gia prompt” rỗng tuếch đó đi. Khoác áo kỹ sư phân xưởng vào. Thiên tài không có mặt ở đây. Chỉ có quy trình lạnh lẽo tạo ra những thứ đẹp đẽ nhất.

Visited 5 times, 5 visit(s) today

M	T	W	T	F	S	S
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31

Cơ Khí Hóa Sự Cảm Nhận

Vụ Cướp Ở Sòng Bài Bellagio

Related Posts

Leave a Reply Cancel reply