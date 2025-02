Được ví như "gã khổng lồ thầm lặng", DeepSeek đang khiến Thung lũng Silicon lo lắng khi sở hữu AI mạnh mẽ dù được xây dựng với chi phí thấp. Đặc biệt, ngày 20/1 vừa qua, DeepSeek tiếp tục tung mô hình mới "có khả năng lý luận" mang tên DeepSeek R1 và đã có mã nguồn trên Github. Theo đánh giá của một số bên thứ ba, AI này thậm chí vượt trội so với o1 mới nhất của OpenAI trong nhiều bài kiểm tra.

″Mô hình DeepSeek mới thực sự ấn tượng. Họ đã biết cách thực hiện hiệu quả một mô hình nguồn mở có khả năng suy luận, đạt hiệu quả tính toán siêu việt", CEO Microsoft Satya Nadella phát biểu tại Diễn đàn Kinh tế Thế giới ở Davos ngày 22/1 khi nói về AI mới của DeepSeek.

Bên cạnh nhà sáng lập, đội ngũ các nhà khoa học giúp DeepSeek tạo ra bước tiến lớn về công nghệ AI cũng thu hút rất nhiều sự chú ý. Trong đó, phải kể đến cái tên "thần đồng AI" mà truyền thông Trung Quốc ưu ái dành tặng cho La Phúc Lị (tên tạm dịch - tên gốc: 罗福莉).

Nữ lập trình viên tài năng vừa tròn 30 tuổi

La Phúc Lị được biết đến là một lập trình viên tài năng trong lĩnh vực ngôn ngữ, nổi bật ở độ tuổi trẻ tại Trung Quốc. Cô đã tham gia vào các nghiên cứu học thuật cũng như phát triển giải pháp AI tại quốc gia đông dân này. Trước đây, La Phúc Lị từng là thành viên của đội ngũ DeepSeek, đóng góp vào quá trình phát triển mô hình V2.

Theo truyền thông Trung Quốc, một nguồn tin nội bộ tiết lộ rằng một chuyên gia AI sinh sau năm 1995 đã nhận được lời mời làm việc với mức lương hấp dẫn từ tỷ phú Lei Jun – nhà sáng lập Xiaomi. Tờ QQ cho biết Xiaomi đang đẩy mạnh đầu tư vào trí tuệ nhân tạo, với số lượng GPU chuyên dụng đã vượt 10.000, tăng đáng kể so với con số 6.500 khi mới thành lập. Lei Jun từng nhấn mạnh rằng chiến lược AI của Xiaomi có sự khác biệt so với các tập đoàn công nghệ lớn khác, tập trung vào tối ưu chi phí và hiệu suất. Đây cũng là lý do khiến ông đặc biệt quan tâm đến La Phúc Lị, một nhân tố quan trọng từng làm việc tại DeepSeek-V2.

Có thông tin cho rằng Xiaomi sẵn sàng chi mức lương 10 triệu NDT/năm (khoảng 34,9 tỷ đồng) để mời La Phúc Lị gia nhập. Liên quan tới vấn đề này, trả lời Red Star News ngày 25/1, La Phúc Lị cho biết, vẫn đang cân nhắc trước lời mời này.

Bắt đầu một cách tình cờ, ghi dấu ấn với hàng loạt "ông lớn" làng công nghệ

Vậy cô gái sinh năm 1995 này sở hữu profile thế nào mà được ông lớn công nghệ “săn đón” hết lòng?

Sau khi hoàn thành chương trình thạc sĩ, La Phúc Lị bắt đầu sự nghiệp tại Phòng thí nghiệm Trí tuệ Máy móc thuộc Viện nghiên cứu Alibaba DAMO. Theo Red Star Capital, cô gia nhập trung tâm này thông qua chương trình All-Star – một trong những hệ thống tuyển chọn khắt khe nhất. Tại Trung Quốc, chương trình này được đánh giá ngang tầm với Genius Youth của Huawei, vốn chỉ dành cho những nhân tài xuất sắc nhất.

Trên các diễn đàn công nghệ trong nước, La Phúc Lị cũng được biết đến rộng rãi. Tuy nhiên, ít ai biết rằng, cô không bắt đầu sự nghiệp trong lĩnh vực này từ sớm.

Ban đầu, cô theo học ngành Khoa học Máy tính tại Đại học Sư phạm Bắc Kinh một cách tình cờ. Bước ngoặt đến khi cô tiếp tục học lên thạc sĩ chuyên ngành Ngôn ngữ học Máy tính, nơi cô công bố nhiều nghiên cứu khoa học về AI, thu hút sự chú ý trên nền tảng Zhihu.

Cô trở thành nhà nghiên cứu Deep Learning tại DeepSeek, đóng vai trò quan trọng trong quá trình phát triển mô hình DeepSeek-V2.

Năm 2019, tại hội nghị ACL về trí tuệ nhân tạo ở Trung Quốc, Phúc Lị gây ấn tượng khi xuất bản được 8 bài báo. Đến nay, cô đã công bố hơn 20 bài báo tại các hội nghị hàng đầu quốc tế. Với hào quang là tác giả của 8 bài báo tại hội nghị ACL, tốt nghiệp thạc sĩ, Phúc Lị được mời về Phòng thí nghiệm trí tuệ nhân tạo thuộc Học viện DAMO của Alibaba làm việc. Tại đây, Phúc Lị tham gia phát triển mô hình tiền đào tạo đa ngôn ngữ VECO và dự án mã nguồn mở AliceMind.

Đến năm 2022, cô gia nhập Huanfang Quantitative để tập trung vào thuật toán và mô hình hóa chiến lược học sâu. Sau đó, cô trở thành nhà nghiên cứu Deep Learning tại DeepSeek, đóng vai trò quan trọng trong quá trình phát triển mô hình DeepSeek-V2.

Tháng 5/2024, DeepSeek cho ra mắt mô hình DeepSeek-V2, ghi lại dấu ấn của Phúc Lị tại đây. Đây là mô hình đặt nền tảng cho sự trỗi dậy của DeepSeek-R1 đang làm khuynh đảo giới công nghệ những ngày qua.

