Bài học đau đớn từ Amazon: Cách phát hiện làn sóng công nghệ tiếp theo

Bài học đau đớn từ Heath Ahrents: Amazon đá họ và Cách phát hiện làn sóng công nghệ tiếp theo

Câu chuyện bài học về lập trình thiên tài Heath Ahrents với iSpeech, và bạn có thể rút ra bài học cho riêng mình

Năm 2007, người dùng đã xây dựng một công ty biến vấn đề phần cứng trị giá 10.000 đô la thành một cuộc gọi API đơn giản. Google, BlackBerry và Motorola trở thành khách hàng của họ. Sau đó, Amazon đã nghiền nát họ chỉ sau một đêm. Bài học đau đớn này đã dạy họ cách phát hiện làn sóng lớn tiếp theo trước những người khác:

Image

Hành trình của họ bắt đầu khi còn là một đứa trẻ lập trình trên máy tính Apple IIGS, mơ ước làm cho máy tính nói chuyện được. Đến năm 2006, họ nhận thấy một vấn đề lớn: chuyển văn bản thành giọng nói đòi hỏi phần cứng đắt tiền. Họ bắt đầu thử nghiệm các nguyên mẫu trong thời gian rảnh rỗi. Sau đó, họ nảy ra một ý tưởng điên rồ:

Điều gì sẽ xảy ra nếu chúng ta có thể xử lý giọng nói trên các máy chủ từ xa? Mọi người đều nói rằng điều đó là không thể:

  • “Không ai sẽ tin tưởng dữ liệu của họ vào các máy chủ từ xa”
  • “Độ trễ sẽ quá cao”
  • “Chất lượng sẽ rất tệ”

Họ không bị thuyết phục.

Trong nhiều tháng, họ làm việc vào ban đêm và cuối tuần. Thử nghiệm các thuật toán nén khác nhau, tối ưu hóa giao thức mạng và xây dựng các công cụ xử lý âm thanh tùy chỉnh. Cuối cùng, nó đã hoạt động.

Image

Vì vậy, họ đã xây dựng iSpeech vào năm 2007 – nhà cung cấp dịch vụ chuyển văn bản thành giọng nói dựa trên đám mây đầu tiên. Thuật ngữ “điện toán đám mây” (cloud computing) mới bắt đầu xuất hiện. Xử lý giọng nói từ xa giống như cố gắng trò chuyện qua một đường ống dài 1 dặm: Các từ phải di chuyển xa, nhưng vẫn phải nghe tự nhiên.

Image

Chuyển văn bản thành giọng nói truyền thống không dễ tiếp cận – nó đòi hỏi phần cứng mạnh mẽ và đắt tiền tại chỗ. Giải pháp của họ? Tạo ra một sản phẩm có thể chạy trên bất kỳ thiết bị nào có kết nối internet. Họ đã giảm một vấn đề phần cứng trị giá 10.000 đô la xuống còn một cuộc gọi API đơn giản. Và chất lượng thực sự tốt hơn.

Trong vòng vài tháng, họ đã mở rộng quy mô lên gần 100 người. BlackBerry, Motorola, Honda, Evernote, GE – tất cả đều trở thành khách hàng. Họ đang cách mạng hóa cách các thiết bị nói. Nhưng họ đã mắc một sai lầm tàn khốc…

Họ đã bỏ lỡ mối đe dọa lớn nhất… Amazon không chỉ xây dựng các trung tâm dữ liệu. Họ đang tạo ra một cơ sở hạ tầng đám mây hoàn chỉnh có thể xử lý giọng nói ở quy mô lớn. Quy mô kinh tế của họ có nghĩa là họ có thể cung cấp dịch vụ của chúng tôi với chi phí chỉ bằng 2%.

Họ đã xây dựng đột phá của mình trên cơ sở hạ tầng máy chủ. Nhưng AWS có thể chạy cùng một quy trình trên hàng nghìn máy chủ đồng thời, với chi phí mà họ không thể cạnh tranh được. Điều làm cho họ trở nên cách mạng – xử lý giọng nói trên đám mây – sắp trở thành một hàng hóa thông thường.

Trải nghiệm đó đã thay đổi cách họ nhìn nhận công nghệ mãi mãi. Những nhà sáng lập giỏi nhất không chỉ phát hiện ra các xu hướng hiện tại. Họ xác định những tương lai không thể tránh khỏi và định vị bản thân phù hợp. Họ đã học cách tìm kiếm những mô hình ẩn mà người khác bỏ lỡ.

Nhiều năm sau, họ nhận thấy điều gì đó kỳ lạ: Họ đang cố gắng mua GPU để đào tạo các mô hình AI, nhưng chúng đã bán hết ở khắp mọi nơi. Điều này không bình thường. Một ai đó lớn hẳn đã mua hết tất cả. Trong khi những người khác coi NVIDIA là một công ty game, họ nhìn thấy điều gì đó khác biệt.

Họ quyết định đầu tư vào NVIDIA (ở mức 30 đô la/cổ phiếu trước khi chia tách). Cái nhìn sâu sắc chính: GPU xử lý các phép tính ma trận nhanh hơn theo cấp số nhân so với CPU – hoàn hảo cho các mô hình AI. Nếu Google đang mua hết GPU, họ biết những người khác sẽ theo sau. Đây là cách họ phát hiện ra cơ hội:

1. Tìm kiếm “tín hiệu không thể tránh khỏi”
Theo dõi nghiêm ngặt 4 chỉ số sau:

  • Mua sắm phần cứng của các công ty lớn
  • Trích dẫn bài báo nghiên cứu
  • Xu hướng đăng ký bằng sáng chế
  • Di cư nhân tài

Bỏ lỡ những điều này và bạn sẽ xây dựng giải pháp cho những vấn đề không còn cần giải quyết nữa.

Năm 2015, họ không thể mua GPU để đào tạo AI. Chúng đã bán hết ở khắp mọi nơi trừ eBay, nơi những chiếc đã qua sử dụng được bán với giá điên rồ. Mọi công ty AI đều đang tích trữ sức mạnh tính toán. Đó là lúc họ kết nối các điểm và đầu tư.

2. Nghiên cứu các nút thắt cổ chai cơ sở hạ tầng
Các câu hỏi chính họ đặt ra:

  • Những tài nguyên nào đang trở nên khan hiếm?
  • Ai đang tích trữ những tài nguyên này?
  • Tiền im lặng đang chảy về đâu?
  • Những giới hạn nào sắp bị phá vỡ?

Công ty tỷ đô tiếp theo ẩn mình trong những nút thắt cổ chai của ngày hôm nay.

3. Theo dõi những người xây dựng
Họ theo dõi một cách ám ảnh:

  • Các kho GitHub đang có đà phát triển
  • Các cuộc thảo luận của nhà phát triển trên Discord
  • Sự phát triển của dự án mã nguồn mở
  • Xu hướng bài đăng blog kỹ thuật

Trong khi mọi người xem tin tức, những khoản tiền lớn được tạo ra từ các commit trên GitHub.

Họ đã làm điều này chính xác vào năm 2019 khi nhận thấy rằng các kho AI giọng nói đang bùng nổ. Các nhà phát triển đang chia sẻ những đột phá hàng ngày. Nhưng tất cả các giải pháp đều có độ trễ 2 giây. Họ đã xây dựng tập trung vào xử lý thời gian thực. Hiện tại, họ đã đạt 50ms và đang cải thiện. voice.ai

4. Theo dõi việc loại bỏ ràng buộc
Giám sát các ngưỡng sau:

  • Giới hạn sức mạnh tính toán
  • Độ nhạy cảm về giá thị trường
  • Chi phí xử lý
  • Khả năng tiếp cận API

Khoảnh khắc một ràng buộc biến mất, một cơ hội xuất hiện.

Mọi người nói rằng thay đổi giọng nói theo thời gian thực là không thể. Nhưng chi phí GPU giảm 50% và xử lý đám mây nhanh hơn 5 lần. Họ biết rằng các ràng buộc đang được dỡ bỏ. Vì vậy, họ đã ra mắt phiên bản beta vào năm 2021 và đạt 25.000 người dùng trong 2 tháng.

5. Nghiên cứu mô hình hành vi người dùng
Tìm kiếm:

  • Yêu cầu tính năng liên tục xuất hiện
  • Giải pháp tạm thời mà mọi người tự tạo ra
  • Những khiếu nại lặp đi lặp lại trên các diễn đàn
  • Cộng đồng hữu cơ đang hình thành

Những sản phẩm tuyệt vời nhất giải quyết các vấn đề mà mọi người đã bắt đầu tự tìm cách khắc phục.

Hãy suy nghĩ theo làn sóng, không phải theo từng khoảnh khắc. Ngừng nhìn vào những gì đang thịnh hành ngay bây giờ… Thay vào đó, hãy định vị bản thân ở nơi:

  • Tiến bộ công nghệ là không thể tránh khỏi
  • Mong muốn của con người vẫn không đổi

Đó là nơi cơ hội ẩn mình… ngay trước mắt.

Khung làm việc này đã giúp họ:

  • Trở thành nhà đầu tư sớm vào công nghệ mới nhất
  • Xây dựng nhiều startup thành công
  • Phát hiện cơ hội ẩn

Similar Posts