Trong thế giới công nghệ ngày càng phát triển, Liang Wenfeng nổi lên như một tên tuổi đáng chú ý với những đóng góp lớn trong lĩnh vực trí tuệ nhân tạo. Là người sáng lập và CEO của DeepSeek, một trong những startup AI đầy tiềm năng. Cùng BurgerPrints tìm hiểu về tiểu sử Liang Wenfeng, từ những bước đi đầu tiên cho đến những thành công vang dội mà ông đã đạt được với DeepSeek.
Liang Wenfeng là ai?
Liang Wenfeng (Lương Văn Phong) là nhà sáng lập và CEO của DeepSeek, một công ty khởi nghiệp về trí tuệ nhân tạo (AI) tại Trung Quốc. Ông hiện đang được chào đón như một người hùng tại quê nhà, và là biểu tượng cho tham vọng AI của Trung Quốc.
Tiểu sử về Liang Wenfeng
Liang Wenfeng chào đời năm 1985 tại tỉnh Quảng Đông, Trung Quốc. Ngay từ nhỏ, ông đã bộc lộ niềm đam mê với khoa học và công nghệ. Xuất thân trong một gia đình có cha mẹ làm trong ngành giáo dục, Liang nhận được sự ủng hộ mạnh mẽ trong việc theo đuổi tri thức và sáng tạo.
Năm 2003, ông trúng tuyển vào Đại học Chiết Giang – một trong những trường đại học hàng đầu Trung Quốc – để theo học ngành kỹ thuật điện tử. Trong thời gian học tập, Liang nổi bật với thành tích xuất sắc khi tham gia các dự án nghiên cứu về thị giác máy tính và tự động hóa đầu tư chứng khoán. Những trải nghiệm này đã giúp ông nhận ra tiềm năng to lớn của trí tuệ nhân tạo (AI), đặt nền móng cho sự nghiệp sau này.
Sự nghiệp của Liang Wenfeng
Liang Wenfeng tốt nghiệp Đại học Chiết Giang với bằng Cử nhân Kỹ thuật Điện tử Thông tin năm 2007 và Thạc sĩ Kỹ thuật Thông tin và Truyền thông năm 2010. Luận văn thạc sĩ của ông có tiêu đề “Nghiên cứu về thuật toán theo dõi mục tiêu dựa trên camera PTZ chi phí thấp”, được hướng dẫn bởi Giáo sư Xiang Zhiyu.
Năm 2008, trong thời gian học tập, Liang cùng các bạn học bắt đầu thu thập dữ liệu liên quan đến thị trường tài chính và khám phá giao dịch định lượng bằng cách sử dụng học máy và các công nghệ khác. Sau khi tốt nghiệp, ông chuyển đến Thành Đô, Tứ Xuyên, để thử nghiệm việc ứng dụng AI vào các lĩnh vực khác nhau, nhưng chỉ thành công khi áp dụng AI vào lĩnh vực tài chính.
Năm 2013, Liang kết hợp AI với giao dịch định lượng và thành lập Công ty Quản lý Đầu tư Hangzhou Yakebi cùng với Xu Jin, một cựu sinh viên Đại học Chiết Giang. Năm 2015, họ đồng sáng lập Công ty Công nghệ Hangzhou Huanfang, hiện là Công ty Quản lý Tài sản Zhejiang Jiuzhang.
Đồng sáng lập High-Flyer Quant
Năm 2015, Liang Wenfeng cùng hai người bạn học kỹ sư đồng sáng lập Công ty Quản lý Đầu tư Định lượng High-Flyer (High-Flyer Quantitative Investment Management), tập trung vào việc sử dụng toán học và trí tuệ nhân tạo (AI) để phát triển các chiến lược đầu tư.
Đến năm 2019, ông thành lập High-Flyer AI, chuyên nghiên cứu về các thuật toán AI và ứng dụng cơ bản của chúng. High-Flyer đã đạt được thành công đáng kể, quản lý danh mục đầu tư trị giá khoảng 100 tỷ nhân dân tệ (tương đương 15,5 tỷ USD) vào năm 2023.
Thành lập DeepSeek
Năm 2023, Liang thành lập DeepSeek, một công ty AI chuyên phát triển các mô hình ngôn ngữ lớn mã nguồn mở. DeepSeek có trụ sở tại Hàng Châu, Chiết Giang, và được sở hữu cũng như tài trợ bởi quỹ đầu cơ High-Flyer. Liang hiện giữ vai trò CEO của DeepSeek.
Từ khi thành lập vào năm 2023, DeepSeek đã liên tục ra mắt nhiều mô hình AI tạo sinh. Mỗi phiên bản mới đều được cải tiến để nâng cao khả năng và hiệu suất:
- DeepSeek Coder (11/2023): Mô hình mã nguồn mở đầu tiên của công ty, chuyên xử lý các tác vụ liên quan đến lập trình.
- DeepSeek LLM (12/2023): Mô hình AI tổng quát đầu tiên của DeepSeek, có thể thực hiện nhiều nhiệm vụ khác nhau.
- DeepSeek-V2 (5/2024): Phiên bản thứ hai của DeepSeek LLM, tập trung vào hiệu suất mạnh mẽ và tối ưu chi phí huấn luyện.
- DeepSeek-Coder-V2 (7/2024): Mô hình có 236 tỷ tham số, với khả năng xử lý ngữ cảnh lên đến 128.000 token, phù hợp với các bài toán lập trình phức tạp.
DeepSeek-V3 (12/2024): Ứng dụng kiến trúc “mixture-of-experts”, giúp xử lý nhiều loại tác vụ khác nhau. Mô hình có 671 tỷ tham số và ngữ cảnh tối đa 128.000 token. - DeepSeek-R1 (1/2025): Dựa trên DeepSeek-V3, mô hình này tập trung vào khả năng suy luận nâng cao và có hiệu suất cạnh tranh trực tiếp với mô hình o1 của OpenAI, nhưng chi phí thấp hơn đáng kể. Cấu trúc gồm 671 tỷ tham số và độ dài ngữ cảnh 128.000 token.
- Janus-Pro-7B (1/2025): Mô hình thị giác AI có khả năng hiểu và tạo hình ảnh.
DeepSeek nhanh chóng gây tiếng vang khi công bố nghiên cứu cho thấy họ chỉ tốn chưa đến 6 triệu USD để huấn luyện mô hình DeepSeek-V3 bằng các chip Nvidia H800. Đáng chú ý, mô hình này đã vượt mặt ChatGPT, trở thành ứng dụng năng suất được tải xuống nhiều nhất trên App Store của Apple.
Fabrizio Del Maffeo, CEO của Axelera AI, cho rằng: “Điều này chứng minh rằng quy mô không phải là yếu tố quyết định duy nhất. Việc phổ biến AI rộng rãi không chỉ giúp giảm chi phí tiếp cận công nghệ mà còn tạo ra cơ hội phát triển mới cho toàn ngành.”
Tham vọng bình dân hóa AI
Chi phí phát triển AI ngày càng leo thang do sự phức tạp của các mô hình, chi phí nhân sự cao và nhu cầu sử dụng phần mềm mạnh mẽ. Các tập đoàn công nghệ lớn như Meta hay Microsoft sẵn sàng rót hàng chục tỷ USD để duy trì năng lực cạnh tranh trong lĩnh vực này. Tuy nhiên, Liang Wenfeng vẫn kiên định với sứ mệnh “bình dân hóa AI”, giúp mọi người có thể tiếp cận công nghệ tiên tiến với chi phí hợp lý.
Trong một phát biểu trên CCTV News, Liang nhấn mạnh triết lý kinh doanh của DeepSeek: “Không bán lỗ, nhưng cũng không tìm kiếm lợi nhuận khổng lồ.” Các dịch vụ của DeepSeek hiện có mức giá đủ để duy trì lợi nhuận vừa phải, nhưng mục tiêu cốt lõi của công ty không phải là thu hút người dùng bằng mọi giá. Thay vào đó, họ giảm chi phí vì tin rằng AI và API nên có giá thành hợp lý để ai cũng có thể tiếp cận và sử dụng.
Theo Forbes, DeepSeek được tài trợ hoàn toàn bởi quỹ đầu tư High-Flyer, giúp họ tự do theo đuổi các dự án AI mang tính đột phá mà không chịu áp lực từ nhà đầu tư bên ngoài. Điều này cho phép công ty tập trung vào nghiên cứu và phát triển dài hạn, thay vì chạy theo lợi nhuận ngắn hạn.
Một số đóng góp của Liang Wenfeng cho AI
Dưới sự dẫn dắt của Liang Wenfeng, DeepSeek không chỉ là một công ty công nghệ mà còn trở thành biểu tượng của đổi mới. Một số thành tựu nổi bật của ông bao gồm:
- Tối ưu hóa chi phí phát triển AI: Với chỉ 6 triệu USD để huấn luyện mô hình V3, DeepSeek đã chứng minh rằng những đột phá công nghệ không nhất thiết phải đi kèm với ngân sách khổng lồ.
- Mở rộng AI đến người dùng phổ thông: Nhờ cung cấp các dịch vụ API giá rẻ, DeepSeek giúp hàng triệu người tiếp cận công nghệ AI một cách dễ dàng hơn.
- Định hướng chiến lược AI của Trung Quốc: Là một trong những nhà lãnh đạo công nghệ chủ chốt, Liang Wenfeng đóng vai trò quan trọng trong việc thúc đẩy sự tự chủ công nghệ của Trung Quốc giữa bối cảnh cạnh tranh gay gắt với phương Tây.
Hướng tới tương lai, Liang Wenfeng không ngừng đặt ra những mục tiêu tham vọng hơn. Ông đang đẩy mạnh kế hoạch mở rộng DeepSeek ra thị trường quốc tế, đồng thời phát triển các sản phẩm AI mới tập trung vào bảo vệ môi trường và nâng cao chất lượng cuộc sống.
Bên cạnh đó, ông cũng cam kết đóng góp vào cộng đồng công nghệ bằng cách đào tạo thế hệ trẻ và tạo điều kiện cho các nhà nghiên cứu tài năng tham gia vào các dự án quan trọng.
Tạm kết
Trên đây là toàn bộ tiểu sử về Liang Wenfeng. Với tầm nhìn chiến lược sắc bén và khả năng sáng tạo không ngừng, Lương Văn Phong và DeepSeek hứa hẹn sẽ tiếp tục dẫn đầu trong lĩnh vực trí tuệ nhân tạo, tạo ra những đột phá mới và góp phần thay đổi ngành công nghệ toàn cầu. Bạn đừng quên theo dõi BurgerPrints để không bỏ lỡ những cập nhật mới nhất từ DeepSeek nhé.