10-15-2013, 04:35 PM
مزدك بامداد نوشته: شاید سرکار مهربد، داده پرداز برجسته ی ما بتواند این چنین چیزی را هم راه بیندازد!
[SIZE=3]•[/SIZE]
[SIZE=3][/SIZE][SIZE=3][/SIZE]
آری شدنش که میشود, به اُمید اسپاگتی این را هم — اگر سرمایهداری به ما پروانهیِ نفس کشیدن از کار داد — درست میکنم (:
تنها دشواری مهندی که باید برداشته شود واژهگزینی با نگرش به بافتار است, که دوست دارم با خوارزمیگهایِ درگاشتِ بیشترینه با آن دست و پنجه نرم کنم, برای نمونه همین "ساعت" در دو بافتار اینجور درمیاید:
ساعت آبیِ زیبایی است = گاهشمار آبی زیباییست / پَنگان زیباییست.
ساعت چنده؟ = تسو چنده؟
ساعت چنده؟ = تسو چنده؟
که خود این نیاز به واگشایش پرسمان بخشگفتار یابی (POSTagging) دارد, نرمافزار باید بگیرد "ساعت آبی" یک نامِ آموده (compound noun) است و "آبی" زاب و ...
یا اینکه یک راهِ آسانتر بتوان یافت.
پارسیگر
.Unexpected places give you unexpected returns