Microsoft เปิดตัวเครื่องมือ Pytho ใหม่สำหรับแปลงไฟล์เอกสารเป็น Markdown

Microsoft เปิดตัวเครื่องมือ Pytho ใหม่สำหรับแปลงไฟล์เอกสารเป็น Markdown


Microsoft สร้างความฮือฮาในวงการพัฒนาเทคโนโลยีด้วยการเปิดตัว MarkItDown ไลบรารี Python แบบโอเพ่นซอร์สที่ช่วยแปลงไฟล์เอกสารหลากหลายประเภทให้เป็น Markdown ภาษา lightweight markup ที่เป็นมิตรกับผู้ใช้และ AI

Markdown เป็นภาษาที่ออกแบบมาเพื่อการจัดการข้อความที่ง่ายต่อการอ่านและเขียน พร้อมทั้งรองรับการใช้งานในเครื่องมือยอดนิยม เช่น GitHub และ Jupyter Notebooks นอกจากนี้ Markdown ยังมีโครงสร้างไวยากรณ์ที่ชัดเจนและสม่ำเสมอ ทำให้ AI สามารถประมวลผลและวิเคราะห์ข้อมูลได้อย่างมีประสิทธิภาพ

MarkItDown ถูกออกแบบมาเพื่อรองรับการแปลงไฟล์หลากหลายรูปแบบ เช่น:

  • PDF (.pdf)
  • PowerPoint (.pptx)
  • Word (.docx)
  • Excel (.xlsx)
  • รูปภาพ (ข้อมูล EXIF และ OCR)
  • เสียง (ข้อมูล EXIF และการถอดเสียงพูด)
  • HTML (รวมถึงการแปลงเว็บไซต์ เช่น Wikipedia)
  • ไฟล์ข้อความอื่นๆ (.csv, .json, .xml)

MarkItDown ยังรองรับการเชื่อมต่อกับ Large Language Models (LLMs) เช่น GPT-4 เพื่อสร้างคำอธิบายภาพ (Image Descriptions) โดยอัตโนมัติ ด้วยโค้ดการตั้งค่าที่เรียบง่าย:

from markitdown import MarkItDown 

from openai import OpenAI 
 

ตั้งค่า Client สำหรับโมเดลภาษา 

client = OpenAI() 
 

ใช้ LLM สร้างคำอธิบายภาพ 

md = MarkItDown(mlm_client=client, mlm_model="gpt-4o") 

result = md.convert("example.jpg") 
 

แสดงผลลัพธ์คำอธิบาย 

print(result.text_content) 

MarkItDown มาพร้อมใบอนุญาต MIT License ช่วยให้นักพัฒนาสามารถใช้งาน แก้ไข หรือแจกจ่ายได้อย่างเสรี เพียงระบุใบอนุญาตต้นฉบับ

วิธีการติดตั้ง

นักพัฒนาสามารถดาวน์โหลดไลบรารี MarkItDown Python ได้ที่นี่ นอกจากนี้ยังสามารถเริ่มต้นใช้งาน MarkItDown ได้ง่ายๆ:

  • ติดตั้งผ่านคำสั่ง pip install markitdown
  • หรือ ติดตั้งจากซอร์สโค้ดด้วยคำสั่ง pip install -e

MarkItDown ไม่เพียงแค่ช่วยแปลงเอกสารต่างๆ เป็น Markdown แต่ยังช่วยยกระดับกระบวนการจัดเก็บและวิเคราะห์ข้อมูล รองรับการใช้งานในโครงการขนาดเล็กไปจนถึงระดับองค์กร

หากคุณไม่ใช่ผู้พัฒนา คุณสามารถทดลองใช้ไลบรารี MarkItDown เป็นแอปเว็บได้ที่นี่

สรุป

Microsoft เปิดตัว MarkItDown ไลบรารี Python แบบโอเพ่นซอร์สสำหรับแปลงไฟล์เอกสาร เช่น PDF, Word, Excel, และ PowerPoint เป็น Markdown ซึ่งเป็นภาษาที่ใช้งานง่ายและเหมาะสำหรับการจัดการข้อมูลที่ AI เข้าใจได้ดี

MarkItDown ยังรองรับการสร้างคำอธิบายภาพโดยใช้ AI อย่าง GPT-4 ผ่านการตั้งค่าที่ง่ายดาย พร้อมใบอนุญาต MIT License ช่วยให้นักพัฒนาสามารถใช้งานและปรับแต่งได้อย่างอิสระ

 

ที่มา neowin


Microsoft ประกาศยกเลิกโปรแกรม WordPad ใน Windows รุ่นถัดไป
Microsoft ได้ตัดสินใจยกเลิก WordPad ซึ่งเป็นแอปพลิเคชันที่มีมายาวนานกว่า 30 ปี ซึ่งเป็นส่วนหนึ่งของระบบปฏิบัติการ Windows บริษัทยืนยันว่าแอปพลิเคชัน...
Microsoft Teams อัปเดตเวอร์ชันใหม่ ปรับแต่งการใช้งานสำหรับ VDI
Microsoft ได้เปิดตัวเวอร์ชันใหม่และปรับปรุง Microsoft Teams บนแพลตฟอร์ม Windows และ Mac ในเดือนตุลาคม 2023 โดยเฉพาะหลังจากที่ได้แสดงตัวอย่างเวอร์ชัน...
Microsoft เปิดตัวฟีเจอร์ใหม่ใน Word for Windows บันทึกไฟล์อัตโนมัติขึ้นคลาวด์ทันที!!
Microsoft เดินหน้าพัฒนา Word for Windows ด้วยฟีเจอร์ใหม่ล่าสุดที่ช่วยให้ผู้ใช้งานไม่ต้องกังวลเรื่องการบันทึกไฟล์อีกต่อไป เพราะทุกไฟล์ใหม่ที่สร้างขึ้...

Quote

Line

Call