سفارش تبلیغ
صبا ویژن

یک روش یادگیری تقویت عمیق بدون مدل برای مقابله با مشکلات کنترل ع

برایان میچل و لیندا پتزولد ، دو محقق در دانشگاه کالیفرنیا ، اخیراً یادگیری تقویت عمیق بدون مدل را در مدلهای پویایی عصبی به کار گرفته اند و به نتایج بسیار امیدوارکننده ای رسیده اند.

 

 

یادگیری تقویت بخشی از یادگیری ماشین با الهام از روانشناسی رفتاری است که الگوریتم هایی را برای انجام مؤثر وظایف خاص ، با استفاده از سیستمی مبتنی بر پاداش و مجازات ، آموزش می دهد. نقطه عطف برجسته در این منطقه توسعه شبکه Deep-Q-DQN (DQN) است که در ابتدا برای آموزش رایانه برای انجام بازی های آتاری مورد استفاده قرار می گرفت.

 

یادگیری تقویتی بدون مدل برای انواع مختلفی اعمال شده است ، اما معمولاً از DQN استفاده نمی شود. دلیل اصلی این امر این است که DQN می تواند تعداد محدودی از اقدامات را پیشنهاد کند ، در حالی که مشکلات جسمی به طور کلی نیاز به روشی دارد که بتواند یک ادامه اقدامات را پیشنهاد دهد.

 

میچل و پتزولد هنگام خواندن ادبیات موجود در مورد کنترل عصبی ، متوجه استفاده گسترده از یک الگوی کلاسیک برای حل مشکلات کنترل عصبی با استراتژی های یادگیری ماشین شدند. ابتدا مهندس و آزمایشگر درباره هدف و طرح مطالعه خود به توافق برسند. سپس ، دومی آزمایش را انجام می دهد و داده هایی را جمع آوری می کند که بعدا توسط مهندس آنالیز می شود و برای ساختن الگویی از سیستم مورد علاقه استفاده می شود. سرانجام ، مهندس کنترلر را برای مدل ایجاد می کند و دستگاه این کنترلر را پیاده سازی می کند.

 

نتایج آزمایش نوسان کنترل در فضای فاز تعریف شده توسط یک جزء اصلی اصلی. اولین طرح از بالا نقشه ورودی به سلول فعال شده با گذشت زمان است. نقشه دوم از بالا نقشه ای از سنبله های کل شبکه است که در آن رنگهای مختلف با سلولهای مختلف مطابقت دارد. طرح سوم از بالا با پتانسیل غشای هر سلول در طول زمان مطابقت دارد. چهارم از طرح بالا نوسانات هدف را نشان می دهد. نمودار پایین نوسان مشاهده شده را نشان می دهد. این سیاست علی رغم ارائه ورودی فقط به یک سلول واحد ، قادر است تقریباً نوسانات هدف را در فضای فاز مشاهده شده القا کند. اعتبار: میچل و پتزولد

"این جریان کار پیشرفت های اخیر در کنترل مستقل از مدل (به عنوان مثال AlphaGo AlphaGo صفر)، که می تواند طراحی کنترل کارآمد تر را نادیده می گیرد،" میچل گفت فناوری XPLORE . "در یک چارچوب عاری از مدل ، مراحل b ، c و d در یک مرحله واحد ترکیب می شوند و هیچ مدل مشخصی ساخته نمی شود. بلکه سیستم عاری از مدل بارها با سیستم عصبی در تعامل است و با گذشت زمان می آموزد که به مطلوب برسد. هدف ما می خواستیم این شکاف را پر کنیم تا ببینیم از کنترل بدون مدل می توان برای حل سریع مشکلات جدید در کنترل عصبی استفاده کرد. "

محققان یک روش یادگیری تقویتی بدون مدل به نام "گرادیان سیاست قطعی عمیق" (DDPG) را تطبیق داده و از آن برای مدل های پویایی عصبی سطح پایین و سطح بالا استفاده کردند. آنها به طور خاص DDPG را انتخاب کردند زیرا چهارچوبی بسیار انعطاف پذیر را ارائه می دهد ، که به کاربر نیازی ندارد که دینامیک سیستم را مدل کند.

 

تحقیقات اخیر نشان داده است که روشهای عاری از مدل معمولاً به آزمایش بیش از حد با محیط احتیاج دارند و استفاده از آنها را برای مشکلات عملی تر سخت تر می کند. با این وجود ، محققان دریافتند که روش بدون مدل آنها عملکرد بهتری نسبت به روشهای مبتنی بر مدل دارد و قادر به حل مشکلات پویایی عصبی دشوارتر ، مانند کنترل مسیرها از طریق فضای فاز نهفته از شبکه تحت عمل نورونها است.

http://socialmediainuk.com/story5569771/قیمت-اکچویتور


تمام روبات های انگشتی که برای کریسمس می خواهند ، دستی مانند Dact

یک بلوک چند رنگی: یک کار بی اهمیت در انتظار انسان است که آن را انتخاب کند ، آنرا بچرخاند ، آن را در کف دست ما بچرخاند. برای یک متخصص ربات ، این یک کار سربالایی است که صعود آن دشوار است. دستکاری دست برای روبات ها همیشه یک چالش بوده است.

 

 

داکتیل را وارد کنید. یک ویدئو OpenAI که روز دوشنبه با عنوان Learning Dexterity منتشر شد ، با افتخار سیستم روبات خود Dactyl را نشان داد که برای دستکاری اشیاء به روشی درجه یک ساخته شده است.

 

لهجه روی کلمه مهارت است. انگشتان دست از بلوک به شکلی کاملاً چشمگیر استفاده می کنند ، از جمله با چرخش کامل بلوک در طرف های مختلف آن. آموخت که چگونه می توان بلوک را به هر جهت دلخواه تبدیل کرد.

 

آنها گفتند که اوان اککرمن ، یک طیف عصبی کنشگری را آموزش داده است تا فقط در 50 ساعت یک دست سایه را برای دستکاری اشیاء کنترل کند .

 

مطمئناً دلیل دیگری که علاقه آنها را جلب کرده این بود که در مدت زمان کوتاه تر کار شده است. آکرمن بر اهمیت تراشیدن زمان برای تیم های روبات تأکید کرد. (شماره ها فروتنانه هستند. IEEE Spectrum 50 دستکاری مکعب موفقیت آمیز را به عنوان نتیجه 6،144 هسته CPU و 8 GPU جمع آوری 100 سال تجربه شبیه سازی شده ربات در 50 ساعت ذکر کرد.)

 

 

برای رسیدن به سطوح "قوی" دستکاری در انسان سالها طول می کشد. Ackerman گفت ، "خوب ، روبات ها چنین وقت ندارند. یادگیری از طریق تمرین و تجربه هنوز راهی برای انجام کارهای پیچیده مانند این است و چالش یافتن راهی برای یادگیری سریعتر و کارآمدتر از فقط دادن است. یک روبات چیزی را دستکاری می کند که بارها و بارها دستکاری کند تا اینکه یاد بگیرد چه چیزی کار می کند و چه چیزی انجام نمی شود ، که احتمالاً حدود صد سال طول می کشد.

 

رویترز نیز به همین ترتیب توضیح داد که چرا کار آنها اهمیت دارد: "آموزش بدنی ماهها یا سالها طول می کشد و مشکلات خاص خود را دارد - به عنوان مثال ، اگر یک دست ربات قطعه کار را رها کند ، یک انسان نیز باید آن را برداشته و آن را به عقب بازگرداند. این نیز گران است. محققان به دنبال این هستند که آن سالها تمرین بدنی را قطع کنند و برای شبیه سازی نرم افزاری که می توانند ساعت ها یا روزها و بدون کمک انسان انجام دهند ، آنها را در چندین رایانه توزیع کنند. "

 

 

 

جنبه جالب دیگر توسط استفان نلیس در مقاله رویترز مورد بررسی قرار گرفت. "محققان سر و صدای تصادفی را در شبیه سازی نرم افزار تزریق کرده و باعث شده دنیای مجازی دست ربات به اندازه کافی کثیف شود که توسط دنیای غیر منتظره در دنیای واقعی دستگیر نشود."

 

در بالا بردن نوار دستکاری ، تیم موفق شده بود تنوع متغیرهایی را پوشش دهد که به خوبی نمی توان مدل سازی کرد. آکرمن نوشت: "این شامل جرم و ابعاد جسم ، اصطکاک هر دو سطح جسم و نوک انگشتان ربات ، چگونگی ضعیف شدن اتصالات ربات ، نیروهای محرک ، محدودیت های مشترک ، واکنش مجدد موتور و سر و صدا و موارد دیگر است."

 

این تیم در ارسال وبلاگ OpenAI خود گفتند که آنها یک دست ربات شبیه به انسان را برای دستکاری اشیاء بدنی "با مهارت های بی سابقه ای" آموزش داده اند. آنها خاطرنشان کردند که چگونه Dactyl کاملاً در شبیه سازی آموزش داده شده است ، "سازگاری با فیزیک دنیای واقعی با استفاده از فنونی که سال گذشته روی آن کار کرده ایم. Dactyl از ابتدا با استفاده از همان الگوریتم یادگیری تقویتی عمومی و کدی مانند OpenAI Five می آموزد."

 

آنها گفتند ، بدون داشتن الگوبرداری دقیق از جهان ، می توان به عوامل شبیه سازی آموزش داد و به آنها فرصت داد تا کارهای دنیای واقعی را حل کنند.

http://dirstop.com/story5844710/قیمت-اکچویتور


ناشناس بودن اخبار \چهره تاری\ یک چرخش هوش مصنوعی می شود

یک تیم تحقیقاتی از دانشکده هنرها و فناوری های تعاملی SFU (SIAT) راهی پیدا کرده اند که در صورت نیاز به ناشناس بودن ، جایگزین کردن استفاده از چهره های "مبهم" شود. روش این تیم از تکنیک های هوش مصنوعی (AI) استفاده می کند که هدف آنها بهبود بصیرت و در عین حال تقویت احساسات گره خورده با داستان است.

 

 

اساتید SIAT استیو دی پائولا و کیت هنسی به همراه تیلور اوون از دانشکده روزنامه نگاری UBC ، برای انجام تحقیقات ، یک کمک هزینه بنیاد گوگل / نایت دریافت کردند. آنها این کار را در یک رویداد نمایشی روزنامه نگاری روزنامه نگاری 360 به افتخار جوایز اعطا شده در نیویورک در تاریخ 24 ژوئیه و روز بعد در یک کنفرانس کامل که از طریق دفتر مرکزی نیویورک تایمز برگزار شد ، به خبرنگاران بین المللی ارائه دادند.

 

دی پائولا ، پیشگام در فرایندهای تشخیص چهره AI / VR ، می گوید: " هدف ما ایجاد یک تکنیک کاری است که در انتقال اطلاعات عاطفی و دانش بسیار بهتر از تکنیک های کنونی ناشناس ماندن باشد."

 

براساس تحقیقات خود ، این تیم با استفاده از رویکرد "نقاشی" AI برای ناشناس سازی ، تکنیک پیکسل سازی به روز شده را ایجاد کرده است.

 

دی پائولا ، که رئیس آزمایشگاه تجسمی تعاملی SFU است ، می گوید: "وقتی هنرمندان یک پرتره را نقاشی می کنند ، سعی می کنند شباهت بیرونی و درونی موضوع را نشان دهند." "با هوش مصنوعی ما که بیش از 1000 سال تکنیک هنری را فرا می گیرد ، ما به این سیستم آموزش داده ایم که شباهت بیرونی را پایین بیاورد و تا حد ممکن شباهت درونی سوژه را حفظ کند - به عبارت دیگر ، چه چیزی انتقال می دهند و چه احساسی دارند. .

محققان دانشگاه سیمون فریزر نشان می دهند که چگونه می توان از AI برای بهبود استفاده از فناوری "چهره تار" در مواردی که ناشناس بودن در گزارشگری خبر لازم است استفاده کرد. اعتبار: SFU

"سیستم ما از 5 سطح پردازش هوش مصنوعی برای شبیه سازی یک نقاش هوشمند استفاده می کند ، با استفاده از انتزاع هنری برای رنگ آمیزی این ویدئو گویی که یک هنرمند هر قاب را نقاشی می کند. نتیجه جذاب تر است ، خصوصاً که همه افراد داستان را نمی شنوند. بنابراین مولفه هنری می شود. مرتبط تر است. "

 

DiPaola خاطرنشان می کند ، این سیستم پیکسل های قاب های ویدئویی را آنطور که می توانند سیستم های Adobe مانند تغییر ندهند ، تغییر می دهند ، اما در عوض نتیجه ای از هر فریم را به دست می آورند. "این در واقع یک فرآیند باز و پویا است که سطح کنترل را در کل امکان پذیر می سازد. ما در نهایت می خواهیم موضوع یا تولید کننده بتواند نتیجه نهایی را بر اساس نیاز آنها تنظیم کند."

 

دی پائولا می گوید که اثربخشی ابزار در ناشناس ماندن در عین حفظ درجه قوی ارتباط عاطفی یا طنین انداز باید محصول نهایی بهتری را برای فیلم های گمنام بخصوص در 360 یا VR بدست آورد. این تیم در نظر دارد تا این فناوری را برای کار در پروژه های متنوع قرار دهد.

 

در حالی که در این کنفرانس ، تیم DiPaola از سوی چندین شرکت بزرگ رسانه ای که به دنبال کشف رویکردهای رسانه ای جدید بودند ، از جمله نیویورک تایمز ، واشنگتن پست و بی بی سی ، علاقه زیادی به دست آورد.

http://prbookmarkingwebsites.com/story5103382/قیمت-اکچویتور


گریپ های نرم را می توان به صورت 3 بعدی روی کشتی های بورد چاپ کرد

اقیانوس عمیق - تاریک ، سرد ، تحت فشار زیاد و بی هوایی - برای انسانها بسیار مهمان نواز است ، اما با ارگانیسم هایی روبرو می شود که می توانند در محیط سخت خود شکوفا شوند. مطالعه این موجودات به تجهیزات تخصصی نصب شده بر روی وسایل نقلیه از راه دور (ROVs) احتیاج دارد که بتوانند در مقابل آن شرایط به منظور جمع آوری نمونه ها مقاومت کنند. این تجهیزات که عمدتاً برای صنایع نفت و معدن زیر آب طراحی شده اند ، با نوع کنترلی لازم برای تعامل با زندگی ظریف دریایی ، مانور سخت ، گران و دشوار است. با استفاده از این ابزار ، چیدن یک گودال دریایی ظریف در کف اقیانوس ، شبیه به تلاش برای بریدن انگور با استفاده از قیچی های هرس است.

 

 

اکنون ، یک گروه چند رشته ای از مهندسین ، زیست شناسان دریایی و روباتیک ها وسیله ای برای نمونه گیری جایگزین تهیه کرده اند که نرم ، انعطاف پذیر و قابل تنظیم است و به دانشمندان این امکان را می دهد تا انواع مختلفی از ارگانیسم ها را از دریا بدون آسیب رساندن به آنها به آرامی بگیرند و 3-D چاپ کنند. اصلاحات دستگاه یک شبه بدون نیاز به بازگشت به آزمایشگاه زمینی. این تحقیق در PLOS One گزارش شده است .

 

راب وود ، دکتری ، مؤسس بنیانگذار دانشکده هسته از موسسه Wyss گفت: "هنگام تعامل با موجودات زیر آب نرم و ظریف ، این حس را بیشتر می کند که تجهیزات نمونه برداری شما نیز نرم و ملایم باشند." همچنین استاد مهندسی و علوم کاربردی رودخانه چارلز در دانشکده مهندسی و علوم کاربردی دانشکده مهندسی هاروارد جان A. پالسون (SEAS). "تازه اخیراً زمینه رباتیک نرم توسعه یافته است تا جایی که در واقع می توانیم روبات هایی بسازیم که بتوانند با اطمینان و بی ضرر این حیوانات را درک کنند."

 

دستگاه های "گیر نرم" که تیم طراحی کرده است از هر دو تا پنج "انگشت" ساخته شده از پلی اورتان و سایر مواد خرد شده که از طریق سیستم پمپ هیدرولیکی کم فشار که از آب دریا برای حرکت دادن حرکت می کند باز و بسته می شوند. گیرنده ها به یک توپ چوبی وصل می شوند که با استفاده از ابزارهای پنجه سخت موجود ROV ، که توسط یک اپراتور انسانی روی کشتی کنترل می شود ، کنترل می شود.

 

این تیم آخرین تکرار نرمافزارهای خود را در یک سفر دریایی R / V Falkor در منطقه حفاظت شده جزایر ققنوس واقع در منطقه اقیانوس آرام جنوبی مستقر کردند. چنین محیطی منزوی به معنای دستیابی قطعات جدید برای گیربکس ها تقریبا غیرممکن است ، بنابراین آنها دو چاپگر 3 بعدی برای ایجاد اجزای جدید در پرواز آوردند.

 

 

"سفر به مدت یک ماه در کشتی به این معنی بود که ما مجبور شدیم هر کاری را که لازم داریم بسازیم. معلوم است که پرینترهای 3 بعدی برای انجام این کار با قایق واقعاً خوب کار کرده اند. و ما توانستیم از اپراتورهای ROV درباره تجربه آنها با استفاده از گیربکس های نرم بازخورد بگیریم و نسخه های جدید را در طول شب تهیه کنیم تا هرگونه مشکل را برطرف کنیم. " .

 

 

 

چنگال های نرم توانستند بسیار مؤثرتر و با آسیب کمتری نسبت به ابزارهای نمونه برداری سنتی در زیر آب ، برفک های دریایی ، مرجان ها ، اسفنج ها و سایر زندگی دریایی را به دست آورند. بر اساس ورودی از اپراتورهای ROV، تیم 3-D-چاپ "ناخن انگشت" پسوند است که می تواند به اضافه پنجه را انگشت به کمک به آنها را نمونه زیر که بر روی سطوح سخت نشسته بودند. همچنین یک مش انعطاف پذیر به هر انگشت اضافه شده است تا به نگه داشتن نمونه های موجود در چنگ انگشتان کمک کند. نسخه دیگری از انگشتان دست دو انگشتی نیز بر اساس آشنایی خلبانان ROV با کنترل گیرنده های دو انگشت موجود ایجاد شده است و درخواست آنها این است که هر دو انگشت بتوانند نمونه هایی را با هر دو دستگیره "خرج کردن" نگه دارند (برای اشیاء کوچک) و درک "قدرت" (برای اشیاء بزرگ).

 

این تیم در حال توسعه گریپ ها هستند ، به امید اضافه کردن حسگرهایی که می توانند هنگام تماس گیرنده ها با ارگانیسم به اپراتور ROV نشان دهند ، "احساس" سخت یا نرم بودن آن را حس کنند و اندازه گیری های دیگری را انجام دهند. در نهایت ، هدف آنها این است که بتوانند موجودات دریایی را در اقیانوس عمیق اسیر کرده و داده های فیزیکی و ژنتیکی کاملی را بدون گرفتن آنها از زیستگاه های بومی خود بدست آورند.

http://bookmark-template.com/story6997061/قیمت-اکچویتور


خلاء ربات Neato روی کاسه سگ نمی چرخد

آیا می خواهید تمیز کردن ربات های شخصی را به سطح بعدی بیاورید؟ پیام تبلیغاتی Neato Robotics مستقر در کالیفرنیا معتقد است که این پاسخ را دارد. ناتو اعلام کرده خلاء ربات خود از بروزرسانی هایی برخوردار است.

 

 

این همه چیز در مورد خلاء ربات D7 متصل Neato ، تنظیم شده برای انجام کارهای خانگی بسیار هوشمندانه است. این شرکت در چالش سالانه کارآفرینان استنفورد متولد شد.

 

چه کسی پس از ناتو ، برای مشتریان است؟ مت پطرسن ، مدیرعامل ناتو گفت برخی از افراد خانه های بزرگی برای تمیز کردن دارند و باید در مورد انجام کار در بیش از یک طبقه فکر کنند .

 

برایان بنت سردبیر ارشد لوازم CNET است. وی گفت که ارتقاء نرم افزار از Neato بسته های هوشمند زیادی را برای پوشاندن "تا سه سطح یک خانه چند طبقه" دارد.

 

به روزرسانی های Multiple Floor Mapping و Neato Quick Boost گفته می شود. این روبات می تواند تمام خانه را به طور خودکار شارژ و تمیز کند.

 

(1) نقشه نویسی چند طبقه ناتو و (2) تقویت سریع (شارژ در Neato Botvac D7) - کلمات حتی به چه معنی هستند؟ "نقشه برداری چند طبقه" برای هر کسی که بیش از یک طبقه برنامه در یک خانه واحد داشته باشد ، است.

 

بنابراین ، این نرم افزار نقشه برداری و تمیز کردن را در چند طبقه امکان پذیر می کند. این دستگاه می تواند برنامه های جداگانه ای را در همان خانه ایجاد کند و به خاطر بسپارد.

 

چطور؟ CNET به "سیستم پیشرفته پیمایش لیزر لیزر" اشاره کرد که در آن سیستم می تواند برای کار به نقشه ها طبقه و اتاق ها و همچنین اجتناب از اشیاء بپردازد. کاربر می تواند دستگاه را از برنامه های کف بررسی بفرستد و سپس از آن نقشه ها برای ترسیم مناطق بدون مراجعه استفاده کند. اوان Ackerman در IEEE Spectrum گفت: نقشه برداری با استفاده از "سنسور لیدینگ چرخشی" رخ می دهد.

 

در واقع ، BGR بخش ناوبری را به عنوان یک ارزش افزوده دانست. کریس میلز: "ویژگی برجسته آن ، در مقایسه با مدل های دیگر ، توانایی نقشه برداری از خانه شما و سپس اضافه کردن مناطق مجازی" بدون حرکت "است که می توانید برای جلوگیری از کاسه حیوان خانگی ، کابل یا حتی از آن استفاده کنید. محدود کردن آن برای تمیز کردن یک اتاق بدون موانع مجازی یا فیزیکی. " آکرمن به طور مشابه توضیح داد که چگونه برنامه ها Neato اجازه می دهد تا شما را به ارتباط برقرار کردن با نقشه ها، در طراحی "بدون رفتن" خطوط برای مناطقی که شما می خواهید به خارج از محدوده به ربات.

 

یکی دیگر از ویژگی های جذاب در مورد این روبات ، نحوه صرفه جویی در مصرف و راندمان آن در صورت نیاز است. CNET در این باره گسترش یافت.

 

"اگر روبات هنگام تمیز کردن به شارژ مجدد نیاز داشته باشد ، دوباره به پایه خود باز می گردد. این باتری را به اندازه کافی پر می کند تا کار خود را تمام کند ، یک شارژ کامل انجام ندهد. برای انجام این کار ، نرم افزار باید عوامل مختلفی را محاسبه و متعادل کند. زمان اجرا پیش بینی شده ، زمان پیش بینی شده برای خالی کردن بقیه کف ، سطح باتری فعلی ، میزان شارژ و غیره. "

 

باهوشه Adrian Willings در Pocket-lint نیز در مورد حالت شارژ اظهار نظر کرد. پاک کننده ربات در واقع می تواند کار کند "چقدر توان لازم برای تمیز کردن منطقه و بازگشت دوباره آن را برای افزایش سریع قدرت قبل از ادامه کار دارد."

 

مت پیترسن ، مدیرعامل Neato ، در بیانیه مطبوعاتی گفت: "این به روز رسانی نرم افزار یک گام مهم به جلو در ناتو در تعهد ما برای نظافت شخصی است ."

http://bookmark-dofollow.com/story6999247/قیمت-اکچویتور