دفترچه

نسخه‌ی کامل: دشواری‌های فاروم
شما در حال مشاهده نسخه آرشیو هستید. برای مشاهده نسخه کامل کلیک کنید.
Bibak نوشته: این امکانی که کلمات ِ پست را به پارسی برگردان میکند چطور فعال میشه؟ منم میخوام.

برگردان نمیکنه. شما باید فارسی بنویسید خودتون. فقط پانویس میکنه.
kourosh_bikhoda نوشته: برگردان نمیکنه. شما باید فارسی بنویسید خودتون. فقط پانویس میکنه.

یعنی خودم باید واژه های پارسیک رو بلد باشم و بکار ببرم؟ فک کردم خودش کلمه هایی رو که مینویسم به پارسی برگردان میکنه. فکر میکردم مثلا اگه بنویسم ساعت، بصورت خودکار مینویسه تسو.. E11b

خب حالا من بلد نیستم راه بندازمش. اگه راه انداختنش راحت هست میخوام امتحانش کنم.
Bibak نوشته: یعنی خودم باید واژه های پارسیک رو بلد باشم و بکار ببرم؟ فک کردم خودش کلمه هایی رو که مینویسم به پارسی برگردان میکنه. فکر میکردم مثلا اگه بنویسم ساعت، بصورت خودکار مینویسه تسو.. E11b

خب حالا من بلد نیستم راه بندازمش. اگه راه انداختنش راحت هست میخوام امتحانش کنم.

ته نوشته ات بنویس پارسیگر بیباک جان: این نوشته به پارسیک است.

پارسیگر
Bibak نوشته: یعنی خودم باید واژه های پارسیک رو بلد باشم و بکار ببرم؟ فک کردم خودش کلمه هایی رو که مینویسم به پارسی برگردان میکنه. فکر میکردم مثلا اگه بنویسم ساعت، بصورت خودکار مینویسه تسو..

بله باید خودتون فارسی بنویسید. این افزونه فقط پانویس میکنه. در انتهای نوشتارتون هم بنویسید پارسیگر تا کار کنه.
Bibak نوشته: فکر میکردم مثلا اگه بنویسم ساعت، بصورت خودکار مینویسه تسو..
شاید سرکار مهربد، داده پرداز برجسته ی ما بتواند این چنین چیزی را هم راه بیندازد!
[SIZE=3][/SIZE]
[SIZE=3][/SIZE][SIZE=3][/SIZE]
مزدك بامداد نوشته: شاید سرکار مهربد، داده پرداز برجسته ی ما بتواند این چنین چیزی را هم راه بیندازد!
[SIZE=3][/SIZE]
[SIZE=3][/SIZE][SIZE=3][/SIZE]

آری شدنش که میشود, به اُمید اسپاگتی این را هم — اگر سرمایه‌داری به ما پروانه‌یِ نفس کشیدن از کار داد — درست میکنم (:

تنها دشواری مهندی که باید برداشته شود واژه‌گزینی با نگرش به بافتار است, که دوست دارم با خوارزمیگ‌هایِ درگاشتِ بیشترینه با آن دست و پنجه نرم کنم, برای نمونه همین "ساعت" در دو بافتار اینجور درمیاید:
ساعت آبیِ زیبایی است = گاهشمار آبی زیبایی‌ست / پَنگان زیبایی‌ست.
ساعت چنده؟ = تسو چنده؟

که خود این نیاز به واگشایش پرسمان بخش‌گفتار یابی (POSTagging) دارد, نرم‌افزار باید بگیرد "ساعت آبی" یک نامِ آموده (compound noun) است و "آبی" زاب و ...

یا اینکه یک راهِ آسانتر بتوان یافت.

پارسیگر
من پیشتر روی یک برنامه بسیار کوچک و ساده کار کردم. مشکلی رو در این برنامه ی مهربد دیدم که منو یاد اون انداخت. اون برنامه ی من درباره تبدیل خط سریلیک تاجیکی به فارسی و برعکس بود. مشکلی که در تبدیل خط فارسی به تاجیکی وجود داشت و در تبدیل تاجیکی به فارسی نداشت این بود که مثلا در خط فارسی واکه های کوتاه(-َ -ِ -ُ) نوشته نمی شود.(البته مشکلات زیاد دیگه ای هم بود، حالا من این یکی رو نام بردم.) مثلا میخواستیم "کی" را از خط فارسی به خط تاجیکی برگردانیم. ولی حداقل با روشهای معمولی، در عمل نمیتوان تشخیص داد که منظور Key به معنای چه وقت است یا Ki به معنای چه کسی. حالا این برنامه ی مهربد هم همین مشکل رو داره. مثلا در "ایران پرس نیوز" واژه Press را چیز دیگری(Pors) برداشت کرده.

حالا میخواستم بگم اگر اون چیزی که مزدک گرامی گفت عملی شود این مشکل شاید برجسته تر بشه... چون در حالت کنونی اگر فلان واژه را اشتباه برداشت کند این اشتباه تنها روی پانویس تاثیر میگذاره ولی در حالتی که پیشنهاد شد این خطاها به متن پست کشیده میشه... امیدوارم هر زودتر از این خط مزخرف خلاص بشیم.
Bibak نوشته: من پیشتر روی یک برنامه بسیار کوچک و ساده کار کردم. مشکلی رو در این برنامه ی مهربد دیدم که منو یاد اون انداخت. اون برنامه ی من درباره تبدیل خط سریلیک تاجیکی به فارسی و برعکس بود. مشکلی که در تبدیل خط فارسی به تاجیکی وجود داشت و در تبدیل تاجیکی به فارسی نداشت این بود که مثلا در خط فارسی واکه های کوتاه(-َ -ِ -ُ) نوشته نمی شود.(البته مشکلات زیاد دیگه ای هم بود، حالا من این یکی رو نام بردم.) مثلا میخواستیم "کی" را از خط فارسی به خط تاجیکی برگردانیم. ولی حداقل با روشهای معمولی، در عمل نمیتوان تشخیص داد که منظور Key به معنای چه وقت است یا Ki به معنای چه کسی. حالا این برنامه ی مهربد هم همین مشکل رو داره. مثلا در "ایران پرس نیوز" واژه Press را چیز دیگری(Pors) برداشت کرده.

حالا میخواستم بگم اگر اون چیزی که مزدک گرامی گفت عملی شود این مشکل شاید برجسته تر بشه... چون در حالت کنونی اگر فلان واژه را اشتباه برداشت کند این اشتباه تنها روی پانویس تاثیر میگذاره ولی در حالتی که پیشنهاد شد این خطاها به متن پست کشیده میشه... امیدوارم هر زودتر از این خط مزخرف خلاص بشیم.

دبیره‌یِ پارسوتازیک (همینی که داریم روی آن مینویسم) یک دبیره‌یِ به درد نخور و ناکارآمد است, بویژه برای زبان ما, ولی برای چیزیکه گفتید, من همه‌یِ این برنامه‌یِ برچسب زن را در چند ساعت برای کارِ خودم سرهم کرده بودم ( نرم‌افزار پارسیک‌نمایِ پی‌نویس - PN² ) و چون شمار این همپوشانی‌ها کم بودند به آن بهایی نداده بودم, ولی نون که کم کم دارد به شمار کاربران برنامه افزوده میشود باید کمی بهکرد و بازویراست, کار چندانی نمیبرد, باید نگریست که:
اول = ul
اَول = avval
اَوِل = avvel
اوَل = avval
اَوَل = avval
اَوَلْ = avval
...

پارسیگر
Bibak نوشته: "ایران پرس نیوز" واژه Press را چیز دیگری(Pors) برداشت کرده.

نیوز را nayuz گرفته بود, از کارواژه‌یِ یوختن (یوزیدن) و نیخوختن (نَیوزیدن).

پارسیگر
Mehrbod نوشته: نیوز را nayuz گرفته بود, از کارواژه‌یِ یوختن (یوزیدن) و نیخوختن (نَیوزیدن).

پارسیگر

بله. به نظرم حق با شماست.