16-dars. Rasm, PDF va fayl bilan prompting
Zamonaviy AI modellari faqat matn emas, rasm, PDF, audio va video bilan ham ishlaydi. Bu imkoniyatdan ko'pchilik hali to'liq foydalanmaydi. Rasm biriktirish, hujjat tahlili va ko'p formatlı so'rovlarda prompt qanday yozilishini bilish — bu kuchli ustunlik.
Mavzu izohi
Multimodal prompting — bir vaqtda matn va boshqa media formatlarini (rasm, hujjat, ovoz) modelga yuborish. GPT-4o, Claude va Gemini bularni qabul qiladi.
Mahsulot rasmi, ish hujjati, screenshot, shartnoma PDF, chizma — bularni yuborib, model bilan tahlil qilish mumkin. Lekin model ko'rish imkoniyati bor deb, u hamma narsani to'g'ri ko'radi degani emas.
Qanday so'rash, nimaga e'tibor qaratish va nima kutilmayotganini aytish — bularning barchasi natijaga ta'sir qiladi. 'Rasmni tahlil qil' emas, aniq savol berish kerak.
Ko'p modellar bir suhbatda bir nechta rasm qabul qiladi. Ularni raqamlash va har biriga alohida murojaat qilish aniqlikni oshiradi.
Bu darsdan nima olasiz
- rasm va hujjat bilan birga prompt yozish usulini bilish
- multimodal promptning to'g'ri tuzilmasini qo'llay olish
- mahsulot rasmi, shartnoma va dizayn fayllari bilan ishlash
- model ko'ra olmaydigan narsalarni oldindan bilish
Dars rejasi
Multimodal nima?
Matn bilan birga rasm, PDF, ovoz yoki video yuborish imkoniyati. GPT-4o, Claude va Gemini bularni qabul qiladi va tahlil qiladi.
Rasmda aniq so'rash
Umumiy 'Rasmni tahlil qil' emas, spetsifik savol: 'Ushbu mahsulot rasmi qaysi bozor segmentiga yo'naltirilgan?' — bu yaxshiroq natija beradi.
Hujjat va PDF bilan ishlash
Shartnoma, hisobot yoki prezentatsiyani yuklab, aniq savol bering. Model butun hujjatni o'qiydi va zarur qismlarni chiqaradi.
Model ko'rmaydigan narsalar
Juda kichik matn, past sifatli rasm, qo'lda yozilgan matn — modellar bularni ba'zan o'tkazib yuboradi. 'Aniq ko'rinmasa, ayt' ko'rsatmasini qo'shing.
Kuchsiz va kuchli prompt taqqoslovi
Ushbu rasmni tahlil qil.
Sen e-commerce dizayn mutaxassisissan. Ushbu mahsulot kartochkasi rasmi bo'yicha: 1) Asosiy UX kamchiliklarni aniqlang; 2) Konversiya oshirish uchun 3 ta tavsiya bering; 3) Rang va tipografiyani baholang. Faqat ko'rgan narsalaringga asoslan.
Ikkinchi prompt rol beradi, aniq vazifalar ro'yxatini belgilaydi va modelni taxmindan saqlash uchun 'faqat ko'rgan narsalaringga asoslan' ko'rsatmasini qo'shadi.
Tayyor prompt shabloni
Ko'chirib moslashtiring[Rasm yoki hujjat biriktirildı]. Sen [rol]. Ushbu [rasm/hujjat/fayl] bo'yicha quyidagilarni bajaring: 1) [birinchi vazifa]; 2) [ikkinchi vazifa]. Faqat ko'rgan yoki o'qigan narsalaringga asoslan — agar aniq ko'rinmasa, menga ayt. Natija formati: [kerakli format].
Nega ishlaydi
Rasmni biriktirish uni tahlil qilishga yetarli emas. Model nimani ko'rib, nimani tahlil qilishini aniq belgilash — bu asosiy qadam.
Hujjat uchun savolni spetsifik qiling: 'Ushbu shartnomadagi to'lov muddatlari qanday?' yaxshiroq ishlaydi, 'Shartnomani tahlil qil' emas.
'Faqat ko'rgan narsalaringga asoslan' ko'rsatmasi modelni taxmin qilishdan saqlaydi va ishonchlilikni oshiradi.
Ko'p rasm ishlatganda ularni raqamlang va har biriga 'birinchi rasmda', 'ikkinchi rasmda' deb murojaat qiling.
Amaliy mashq
- Mahsulotingiz yoki ishingizga oid bitta rasm yoki screenshot toping.
- Rasmni ChatGPT yoki Claude-ga yuboring va 'Rasmni tahlil qil' deb so'rang — natijani yozing.
- Xuddi shu rasmni 3 aniq savol bilan qayta so'rang: masalan, 'Ushbu dizayndagi asosiy rang nima?'
- Ikkala javobni solishtiring va aniq so'rov qanday farq qilganini baholang.
Mini loyiha
Mini loyiha: hujjat yoki rasm tahlili
Ishingizga oid bitta hujjat, shartnoma yoki mahsulot rasmi oling va AI yordamida to'liq tahlil qiling.
Bajariladigan ishlar
- Tahlil qilmoqchi bo'lgan hujjat yoki rasmni tanlang.
- Aniq 3 ta savol yozing: nima bilishingiz kerakligini aniqlang.
- ChatGPT yoki Claude-ga yuklab, shu 3 savolni bering.
- Natijani tekshiring: model nimani to'g'ri ko'rdi, nimani o'tkazib yubordi.
Natijada nima tayyor bo'ladi
- tahlil qilingan hujjat yoki rasm
- 3 ta aniq savol va AI javobi
- natijani baholash: to'g'ri va noto'g'ri qismlar
Tekshiruv ro'yxati
Ko'p uchraydigan xatolar
- 'Rasmni tahlil qil' deb umumiy so'rash — model nima qilishini bilmay umumiy tavsif beradi
- model ko'ra olmaydiganlarni kutish: juda kichik matn, past sifatli rasm
- rasm bor deb kontekstni tushuntirib o'tirmaslik
- bir vaqtda ko'p rasm yuborib, har biriga aniq savol bermaslik
Dars bo'yicha savol-javob
Barcha modellar rasmni ko'ra oladimi?
Yo'q. GPT-4o, Claude 3 va Gemini Pro rasm qabul qiladi. Eski modellar yoki matn-only modellar rasmni qayta ishlaymaydi.
PDF-ni to'g'ridan-to'g'ri yuborish mumkinmi?
Claude va Gemini PDF-ni to'g'ridan-to'g'ri qabul qiladi. ChatGPT-da PDF-ni matn sifatida joylashtirish yoki Code Interpreter orqali yuborish mumkin.