Data science meets life science: deep learning inzetten voor betere diagnostiek bij kanker

De inzet van machine learning voor het analyseren van medische afbeeldingen minimaliseert de kans op medische missers en versnelt het stellen van medische diagnoses. Dit blijkt uit recent onderzoek van Dell-onderzoekers Mauro Damo, Wei Lin, Ronaldo Braga en William Schneider uit Californië, VS.

deep learning

Deep learning bij onderzoek naar blaaskanker
De datawetenschappers van Dell hebben gepoogd blaaskanker te identificeren door gebruik te maken van 5.000 MRI-scanafbeeldingen van het Cancer Imaging Archive. Ze maakten daarbij gebruik van een zes-laags Convolution Neural Network (CNN). Dergelijke netwerken hebben eerder succesvol gezichten, objecten en verkeersborden geïdentificeerd en worden vaker ingezet als oren en ogen van robots en zelfrijdende auto’s.

Het Dell-onderzoek richtte zich op vier van de veertien primaire tumorvarianten (T2a, T2b, T3a en T4a) bij patiënten bij wie reeds blaaskanker was geconstateerd. Tevens werden algoritmes ingezet om significante verschillen te identificeren tussen de afbeeldingen om te beoordelen welke kenmerken van belang zijn bij het detecteren van blaaskanker. Blaaskanker is de op drie na meest voorkomende kanker bij mannen en raakt wereldwijd jaarlijks 430.000 mensen en hun families. De directe medische kosten van blaaskankerzorg waren in 2010 wereldwijd 125 miljard dollar.

Voor het onderzoek maakte het onderzoeksteam gebruik van krachtige hardware en open-source software, waaronder:

  • Dell PowerEdge-servers met Intel Xeon E5-2680 processoren @ 2.7 GHz met 8 cores en 384 GB
  • NVIDIA GRID K2 met 2 GPU’s
  • Python open-source scripts
  • TensorFlow 1.4 open-source deep learning package
  • SimpleITK open-source image transformation package

Poweredge

Geheugen en nauwkeurigheid
De onderzoekers ontdekten onder meer dat GPU- en CPU-geheugen relevanter zijn dan hardware cycles wanneer met medische data wordt gewerkt en dat ‘out of memory’-fouten veel voorkomend zijn. Voor modellen die weken moeten draaien is het van groot belang om het geheugen en de cycles te verbeteren, of gebruik te maken van een gedistribueerd platform. Anders heeft het de voorkeur het geheugen uit te breiden, aangezien er voldoende geheugen nodig is om alle weights initialization- en mini batch-processen aan te kunnen.

Met behulp van het zes-laagse CNN-netwerk is de Top 1-nauwkeurigheid van het deep learning-model dat gebruikt is in het onderzoek verbeterd van 72,3 procent naar 81,3 procent. Dit maakt het interessant om vergelijkbare technieken te verkennen in andere praktische toepassingen. De onderzoekers geven aan dat de resultaten naar alle waarschijnlijkheid zullen verbeteren wanneer er meer data beschikbaar is van de vroege stadia van kanker, er meerdere soorten primaire tumoren worden geanalyseerd en er onafhankelijke CNN-modellen voor alle anatomische vlakken van het menselijk lichaam worden gebruikt.

Om meer te lezen over de mogelijkheden van deep learning om onderzoek en processen in de gezondheidszorg, financiële dienstverlening, retail, productie en andere industrieën te verbeteren, ga naar Dell Ready Solutions for AI, Machine and Deep Learning of neem contact op met uw Dell-contactpersoon.

About the Author: Janet Morss

Passionate about data analytics, including machine learning and high performance computing, Janet Morss works in product marketing. Her favorite: Sharing the amazing impact our customers have on people's lives using technology. Prior to joining Dell EMC, Janet worked in HPE Server Strategy, Planning and Operations with a focus on SMB and Enterprise solutions. With multiple degrees and a love of learning, Janet is a start-up style marketer from Colorado who loves to snowboard.