ข่าว Tech

TikTok ใช้ Bytespider เก็บข้อมูลเร็วกว่า OpenAI 25 เท่า

ByteDance บริษัทแม่ของ TikTok ได้สร้างความฮือฮาด้วยเครื่องมือขุดข้อมูลเว็บที่ชื่อว่า “Bytespider” ซึ่งมีความเร็วในการเก็บรวบรวมข้อมูลจากอินเทอร์เน็ตมากกว่าเครื่องมือของบริษัทอื่น ๆ ถึงหลายเท่า รายงานจากสื่อ Fortune ระบุว่า Bytespider ซึ่งปรากฏตัวครั้งแรกในเดือนเมษายน มีอัตราการขุดข้อมูลที่ทำให้เครื่องมือของ OpenAI, Google, Meta และ Anthropic ดูช้าลงไปมากเมื่อเทียบกัน

ในช่วงหลายสัปดาห์ที่ผ่านมา Bytespider ได้แสดงศักยภาพในการขุดข้อมูลด้วยอัตราที่สูงถึง 25 เท่าของ GPTbot ของ OpenAI และมากกว่า 3,000 เท่าของ ClaudeBot จาก Anthropic ข้อมูลนี้ได้รับการเปิดเผยโดย Sam Crowther CEO ของ Kasada ซึ่งเป็นบริษัทที่เชี่ยวชาญในการจัดการกับบ็อต เขาระบุว่า Kasada ได้เห็นการเพิ่มขึ้นอย่างมหาศาลของกิจกรรมการขุดข้อมูลจาก Bytespider ในช่วง 6 สัปดาห์ที่ผ่านมา โดยแสดงให้เห็นถึงความเร่งด่วนของ ByteDance ที่ต้องการสะสมข้อมูลจำนวนมหาศาล

ByteDance ไม่เพียงเป็นเจ้าของแอปพลิเคชันโซเชียลมีเดียที่ได้รับความนิยมอย่าง TikTok แต่ยังดูเหมือนจะเตรียมพร้อมสำหรับการพัฒนาเทคโนโลยีปัญญาประดิษฐ์ (AI) ระดับสูงของตัวเอง หนึ่งในเครื่องมือสำคัญที่บริษัทใช้คือ “Bytespider” ซึ่งเริ่มทำงานตั้งแต่เดือนเมษายน โดย Bytespider ได้แสดงให้เห็นถึงศักยภาพในการขุดข้อมูลบนเว็บได้เร็วกว่าเครื่องมือจากบริษัทเทคโนโลยียักษ์ใหญ่อื่น ๆ

Sam Crowther ซีอีโอของ Kasada ซึ่งเป็นบริษัทที่เชี่ยวชาญในการป้องกันการโจมตีจากบ็อต กล่าวว่า Bytespider มีความเร็วในการขุดข้อมูลที่น่าทึ่ง ข้อมูลจาก Kasada แสดงให้เห็นว่ากิจกรรมการขุดข้อมูลของ Bytespider เพิ่มขึ้นอย่างมหาศาลในช่วง 6 สัปดาห์ที่ผ่านมา ซึ่งเป็นอัตราที่สูงกว่าการขุดข้อมูลของ GPTbot ของ OpenAI ถึง 25 เท่า และ ClaudeBot ของ Anthropic ถึง 3,000 เท่า ซึ่งชี้ให้เห็นถึงการเคลื่อนไหวอย่างรวดเร็วของ ByteDance ในการสะสมข้อมูลเพื่อใช้พัฒนาเทคโนโลยีใหม่ ๆ

Advertisement

ในขณะที่ Bytespider กำลังเร่งการขุดข้อมูล อินเทอร์เน็ตทั่วโลกก็กำลังถูกดูดซับเข้าไปในฐานข้อมูลขนาดมหึมาของ ByteDance โดยมีความเป็นไปได้ว่า ByteDance กำลังเตรียมตัวปล่อยโมเดลภาษาใหญ่ (LLM) ของตัวเอง รายงานจาก Fortune ชี้ว่า Bytespider กำลังขุดข้อมูลเพื่อใช้ในการฝึกสอนโมเดลปัญญาประดิษฐ์ของบริษัท ซึ่งการสะสมข้อมูลที่มหาศาลนี้จะนำไปสู่การพัฒนา AI ที่ก้าวล้ำยิ่งขึ้น

อย่างไรก็ตาม ในขณะที่ ByteDance กำลังเดินหน้าไปอย่างรวดเร็ว สหรัฐอเมริกาก็พยายามจำกัดการเข้าถึงข้อมูลของผู้ใช้ชาวอเมริกันจากรัฐบาลจีน ในเดือนเมษายน ประธานาธิบดี Joe Biden ได้ลงนามในกฎหมายที่กำหนดให้ TikTok ต้องขายออกไปจากการถือครองของ ByteDance ภายในหนึ่งปี มิฉะนั้นแอปนี้อาจถูกแบนจากตลาดสหรัฐฯ จึงเป็นไปได้ว่าความเร่งรีบในการขุดข้อมูลนี้เกี่ยวข้องกับเส้นตายที่บริษัทต้องเผชิญ

แม้ว่าเราจะยังไม่ทราบแน่ชัดว่า ByteDance มีแผนจะทำอะไรกับข้อมูลจำนวนมหาศาลที่ขุดมาได้ แต่ TikTok ได้เปิดตัวฟีเจอร์ที่ขับเคลื่อนด้วย AI หลายตัวในช่วงที่ผ่านมา หนึ่งในนั้นคือเครื่องมือสำหรับนักโฆษณาในการสร้างโฆษณาด้วย AI ซึ่งเปิดตัวในเดือนพฤษภาคม ฟีเจอร์อื่น ๆ เช่น การสร้างอวาตาร์ด้วย AI สำหรับแบรนด์และครีเอเตอร์ ก็เป็นอีกก้าวสำคัญในการนำเทคโนโลยี AI มาสู่การใช้งานในวงกว้าง

นอกจากนี้ ยังมีข่าวลือว่า TikTok กำลังทำงานเกี่ยวกับเครื่องมือค้นหาภายในแพลตฟอร์ม ที่อาจจะใช้ปัญญาประดิษฐ์เป็นตัวช่วยในการแสดงผลการค้นหา โดยคาดว่าอาจมีการใช้โมเดลที่คล้ายคลึงกับ ChatGPT ของ OpenAI การนำ AI มาช่วยในการค้นหานี้อาจทำให้ TikTok กลายเป็นแพลตฟอร์มที่มีฟังก์ชันการค้นหาที่ทรงพลังและตอบสนองต่อความต้องการของผู้ใช้มากยิ่งขึ้น

การตอบสนองต่อการเปลี่ยนแปลงของกฎหมายสหรัฐฯ

ความเคลื่อนไหวของ ByteDance ในการเร่งขุดข้อมูลด้วย Bytespider อาจเป็นผลมาจากความจำเป็นในการปรับตัวให้เข้ากับข้อกำหนดทางกฎหมายที่สหรัฐฯ ตั้งไว้ ในขณะที่รัฐบาลสหรัฐฯ พยายามจำกัดการเข้าถึงข้อมูลของผู้ใช้จากรัฐบาลจีน ความเสี่ยงที่ TikTok จะถูกแบนจากตลาดสหรัฐฯ หาก ByteDance ไม่สามารถขายแอปนี้ออกจากการถือครองได้ในเวลาที่กำหนด ทำให้บริษัทต้องเดินหน้าพัฒนาเทคโนโลยีใหม่ ๆ ให้เร็วขึ้น

Bytespider เป็นเครื่องมือที่ช่วยให้ ByteDance ขุดข้อมูลบนอินเทอร์เน็ตด้วยอัตราความเร็วที่มากกว่าเครื่องมือขุดข้อมูลของคู่แข่งหลายเท่า ความเร็วนี้ช่วยให้ ByteDance สามารถสะสมข้อมูลจำนวนมากเพื่อใช้ในการฝึกสอนโมเดล AI ของตัวเอง และยังสามารถสร้างข้อได้เปรียบในตลาดปัญญาประดิษฐ์ที่กำลังเติบโตขึ้นอย่างรวดเร็ว

ข้อสงสัยเกี่ยวกับการใช้งานข้อมูลที่ขุดมา

แม้ว่า ByteDance จะมีการขุดข้อมูลจำนวนมาก แต่ก็ยังไม่ชัดเจนว่าบริษัทมีแผนจะนำข้อมูลเหล่านี้ไปใช้อย่างไร มีความเป็นไปได้ว่าบริษัทอาจนำข้อมูลไปใช้ในการพัฒนาโมเดลปัญญาประดิษฐ์ของตัวเอง หรือใช้ในการปรับปรุงอัลกอริทึมของ TikTok ให้ดีขึ้น นอกจากนี้ยังมีการคาดการณ์ว่า ByteDance อาจพัฒนาเทคโนโลยีที่เกี่ยวข้องกับการสร้างเนื้อหาด้วย AI หรือการค้นหาด้วย AI ซึ่งจะทำให้ TikTok และแพลตฟอร์มอื่น ๆ ในเครือมีความสามารถที่เหนือชั้นมากยิ่งขึ้น

การที่ ByteDance ใช้ Bytespider ขุดข้อมูลได้เร็วกว่าเครื่องมือจาก OpenAI, Google, และ Meta ทำให้บริษัทสามารถเข้าถึงข้อมูลจำนวนมหาศาลที่อาจนำไปใช้ในการพัฒนาเทคโนโลยีใหม่ ๆ ในอนาคตได้ แม้ว่าเราจะยังไม่ทราบแน่ชัดว่าบริษัทจะใช้ข้อมูลเหล่านี้อย่างไร แต่เป็นที่ชัดเจนว่า ByteDance กำลังอยู่ในกระบวนการเร่งรีบเพื่อสะสมข้อมูลให้ได้มากที่สุดเท่าที่จะเป็นไปได้

ทิ้งท้าย

การที่ ByteDance ใช้ Bytespider ในการขุดข้อมูลอินเทอร์เน็ตด้วยความเร็วที่เหนือกว่าเครื่องมือของบริษัทอื่น ๆ เป็นสัญญาณที่ชัดเจนว่าบริษัทกำลังเตรียมพร้อมสำหรับการพัฒนาเทคโนโลยีปัญญาประดิษฐ์และอัลกอริทึมใหม่ ๆ แม้ว่าจะยังไม่ชัดเจนว่า ByteDance จะนำข้อมูลเหล่านี้ไปใช้ทำอะไร แต่สิ่งหนึ่งที่แน่นอนคือการขุดข้อมูลจำนวนมากนี้จะนำไปสู่การพัฒนาและนวัตกรรมใหม่ ๆ ที่น่าจับตามองในอนาคต การเคลื่อนไหวอย่างรวดเร็วของ ByteDance อาจมีส่วนเกี่ยวข้องกับแรงกดดันทางกฎหมายจากสหรัฐฯ แต่ไม่ว่าเหตุผลจะเป็นอย่างไร ByteDance กำลังสร้างความก้าวหน้าในด้าน AI อย่างต่อเนื่อง

Advertisement

กดเพื่ออ่านเพิ่มเติม
Advertisement

Tanjen S.

ติดตามข่าวสารล่าสุดในวงการไอทีและเกมส์ วิเคราะห์ข้อมูล และนำเสนอเป็นบทความข่าวที่น่าสนใจ อ่านง่าย และเข้าใจง่าย

บทความที่เกี่ยวข้อง

ใส่ความเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *

Back to top button