10-15-2013, 06:39 PM
Mehrbod نوشته: آری شدنش که میشود, به اُمید اسپاگتی این را هم — اگر سرمایهداری به ما پروانهیِ نفس کشیدن از کار داد — درست میکنم (::e303:شما نخست از واژه هایی که یک برابر بیشتر ندارند، آغاز کنید و برای مانده، "پیشنهاد" بدهید در پایین ، درست مانند همین فهرستی که پارسیگر درست میکند!
تنها دشواری مهندی که باید برداشته شود واژهگزینی با نگرش به بافتار است, که دوست دارم با خوارزمیگهایِ درگاشتِ بیشترینه با آن دست و پنجه نرم کنم, برای نمونه همین "ساعت" در دو بافتار اینجور درمیاید:ساعت آبیِ زیبایی است = گاهشمار آبی زیباییست / پَنگان زیباییست.
ساعت چنده؟ = تسو چنده؟
که خود این نیاز به واگشایش پرسمان بخشگفتار یابی (POSTagging) دارد, نرمافزار باید بگیرد "ساعت آبی" یک نامِ آموده (compound noun) است و "آبی" زاب و ...
یا اینکه یک راهِ آسانتر بتوان یافت.
پارسیگر
[SIZE=3]•[/SIZE]
[SIZE=3][/SIZE][SIZE=3][/SIZE]
خرد، زنـده ی جــاودانی شنـــاس
خرد، مايــه ی زنــدگانی شنـــاس
چنان دان، هر آنكـس كه دارد خرد
بــه دانــش روان را هــمی پــرورد