GPT টোকেনাইজার
বিভিন্ন AI মডেলের জন্য টেক্সট টোকেনাইজ করুন।
ইনপুট
আউটপুট
রিডমি
AI ভাষা মডেলে টোকেনাইজেশন কী?
টোকেনাইজেশন হল পাঠ্যকে ছোট ইউনিটে বিভক্ত করার প্রক্রিয়া যাকে টোকেন বলা হয়, যা AI ভাষা মডেলগুলি পাঠ্য বুঝতে এবং প্রক্রিয়া করতে ব্যবহার করে। একটি টোকেন একটি শব্দ, শব্দের একটি অংশ বা এমনকি একটি একক অক্ষর হতে পারে। উদাহরণস্বরূপ, "hello" একটি টোকেন হতে পারে, যখন "unprecedented" একাধিক টোকেনে বিভক্ত হতে পারে যেমন "un", "pre", "cedent" এবং "ed"। টোকেনাইজেশন বোঝা গুরুত্বপূর্ণ কারণ AI মডেলগুলির তাদের ইনপুট এবং আউটপুটের জন্য টোকেন সীমা রয়েছে এবং API খরচ প্রায়শই ব্যবহৃত টোকেনের সংখ্যার উপর ভিত্তি করে গণনা করা হয়।
টুল বর্ণনা
GPT Tokenizer টুল আপনাকে দেখতে দেয় যে OpenAI এর বিভিন্ন GPT মডেল কীভাবে পাঠ্য ইনপুট টোকেনাইজ করে। আপনি যেকোনো পাঠ্য প্রম্পট প্রবেশ করতে পারেন এবং বিস্তৃত GPT মডেলগুলির মধ্য থেকে নির্বাচন করতে পারেন যাতে রঙ-কোডেড ভিজ্যুয়ালাইজেশন সহ টোকেন ব্রেকডাউন দেখা যায়। প্রতিটি টোকেন একটি অনন্য রঙ দিয়ে হাইলাইট করা হয়, যা মডেল আপনার পাঠ্য কীভাবে প্রক্রিয়া করে তা বুঝতে সহজ করে তোলে। টুলটি মোট টোকেন গণনা প্রদর্শন করে এবং আরও ভাল দৃশ্যমানতার জন্য বিশেষ অক্ষর (স্পেসগুলি ডট এবং লাইন ব্রেকগুলি তীর হিসাবে) দেখায়।
উদাহরণ
ইনপুট:
- মডেল: GPT-5
- প্রম্পট: "Hello, how are you today?"
আউটপুট:
- টোকেন: 7
- ভিজ্যুয়ালাইজেশন: প্রতিটি শব্দ/বিরাম চিহ্ন বিভিন্ন রঙে দেখানো হয়েছে
বৈশিষ্ট্য
- একাধিক মডেল সমর্থন: 30+ GPT এবং OpenAI মডেল থেকে নির্বাচন করুন
- রিয়েল-টাইম টোকেনাইজেশন: আপনি টাইপ করার সাথে সাথে টোকেনগুলি তাৎক্ষণিকভাবে আপডেট হতে দেখুন
- রঙ-কোডেড ভিজ্যুয়ালাইজেশন: সহজ সনাক্তকরণের জন্য প্রতিটি টোকেন একটি অনন্য রঙ পায়
- বিশেষ অক্ষর প্রদর্শন: স্পেসগুলি ডট (·) এবং লাইন ব্রেকগুলি তীর (↵) হিসাবে দেখানো হয়
- টোকেন গণনা: ব্যবহৃত মোট টোকেনের রিয়েল-টাইম প্রদর্শন
- মডেল-নির্দিষ্ট এনকোডিং: প্রতিটি মডেল তার নিজস্ব টোকেনাইজেশন নিয়ম ব্যবহার করে
সমর্থিত মডেল
টুলটি নিম্নলিখিত OpenAI মডেলগুলি সমর্থন করে:
ChatGPT সিরিজ:
- ChatGPT-4o Latest
GPT-5 সিরিজ:
- GPT-5
- GPT-5 Pro
- GPT-5 mini
- GPT-5 nano
GPT-4.x সিরিজ:
- GPT-4.5 Preview
- GPT-4.1
- GPT-4.1 mini
- GPT-4.1 nano
GPT-4 সিরিজ:
- GPT-4o
- GPT-4o mini
- GPT-4
- GPT-4 turbo
GPT-3.5 সিরিজ:
- GPT-3.5 turbo
- GPT-3.5 turbo instruct
O-সিরিজ (রিজনিং মডেল):
- o4-mini
- o3
- o3-mini
- o3-pro
- o1
- o1-mini
- o1-preview
- o1-pro
লিগেসি মডেল:
- text-davinci-003
- text-davinci-002
- text-davinci-001
ব্যবহারের ক্ষেত্র
- API খরচ অনুমান: API কল করার আগে টোকেন ব্যবহার গণনা করুন খরচ অনুমান করতে
- প্রম্পট অপ্টিমাইজেশন: পাঠ্য কীভাবে টোকেনাইজ করা হয় তা বুঝে টোকেন গণনা হ্রাস করুন
- প্রসঙ্গ উইন্ডো পরিকল্পনা: নিশ্চিত করুন যে আপনার প্রম্পটগুলি মডেল টোকেন সীমার মধ্যে ফিট করে
- AI প্রতিক্রিয়া ডিবাগিং: বুঝুন কেন নির্দিষ্ট ইনপুটগুলি অপ্রত্যাশিত আউটপুট তৈরি করে
- শিক্ষামূলক উদ্দেশ্য: বিভিন্ন মডেলগুলি কীভাবে টোকেনাইজেশন পরিচালনা করে তা শিখুন
- বিষয়বস্তু দৈর্ঘ্য পরিকল্পনা: টোকেন সীমাবদ্ধতার মধ্যে ফিট করে এমন বিষয়বস্তু পরিকল্পনা করুন