ProgressCommunications.euwww.whizpr.nlwww.marcommit.nl
www.whizpr.nlINFLUX PRwww.whizpr.nl

Volg ook via:
Datum: (1 jaar en 34 dagen geleden)
Bedrijf:
PR: Clarity Benelux

Red Hat maakt generatieve AI breed inzetbaar met Red Hat AI Inference Server

  • Red Hat Inference Server combineert vLLM en Neural Magic voor snellere, efficiëntere AI-inference in elke hybride cloudomgeving
  • Samenwerking met Google Cloud maakt Red Hat Inference Server native beschikbaar op Google Cloud
BOSTON, 21 mei 2025 Red Hat, marktleider in open source-oplossingen, kondigt vandaag Red Hat AI Inference Server aan. Deze nieuwe oplossing binnen Red Hat AI laat bedrijven generatieve AI sneller, goedkoper en flexibeler draaien, ongeacht het AI-model, de hardware of de cloudomgeving. De tool is gebouwd op de vLLM-communitytechnologie (“virtualized Large Language Model inference”) van UC Berkeley en wordt versterkt met compressie en optimalisatie via Neural Magic. Het nieuws werd bekendgemaakt tijdens de jaarlijkse Red Hat Summit, dit jaar in Boston.

Red Hat Inference Server kan zelfstandig draaien of geïntegreerd worden in Red Hat Enterprise Linux AI (RHEL AI) en Red Hat OpenShift AI. Organisaties kunnen zo AI veel vlotter en betrouwbaarder in productie inzetten.

Inference wordt de motor van AI
Inference is het moment waarop een AI-model antwoord geeft op een vraag. Die fase vergt echter veel rekenkracht. Als AI-oplossingen schalen, kan inference snel traag, duur en foutgevoelig worden. Daarom is een krachtige, efficiënte inference-server essentieel.

Red Hat AI Inference Server pakt dat aan met een krachtige, open oplossing met ingebouwde compressie en optimalisatie, zodat inference zelfs met zware modellen en op verschillende infrastructuren snel verloopt.

vLLM als fundament
De basis van Red Hat AI Inference Server is het vLLM-project: een snelgroeiende communitytool van UC Berkeley voor krachtige inference, met brede modelondersteuning en geavanceerde functies zoals multi-GPU support en grote contextverwerking.

vLLM wordt vandaag al gebruikt voor toonaangevende modellen als Llama, Mistral, DeepSeek, Phi, Llama Nemotron en Gemma – en groeit uit tot dé standaard voor inference.

Red Hat AI Inference Server combineert het beste van vLLM en Red Hat:
  • Slimme compressie: verkleint modellen zonder nauwkeurigheid te verliezen, met minder hardwaregebruik als resultaat.
  • Geoptimaliseerde modelkeuze: een Red Hat-modelrepository op Hugging Face met gevalideerde modellen voor directe inzet.
  • Red Hat-ondersteuning: enterprise support en ervaring met open source-projecten in productie.
  • Brede inzetbaarheid: werkt ook op andere Linux- en Kubernetes-platformen dan die van Red Hat, in lijn met het 3rd Party Support-beleid.
Eén platform voor elke AI-toepassing
Red Hat wil inference democratiseren: elk model, op iedere accelerator en op welke cloud dan ook. Géén beperkingen of keuzestress, wél vrijheid en schaalbaarheid. Zoals Red Hat vroeger Linux openbrak voor het bedrijfsleven, wil het nu inference standaardiseren voor AI. Met vLLM en llm-d als hoekstenen van een open ecosysteem wil Red Hat bedrijven klaarstomen voor het AI-tijdperk – op een flexibele, schaalbare wijze en zonder onnodige kosten.

“Inference is het hart van generatieve AI. Het moet snel én betaalbaar zijn. Met Red Hat AI Inference Server bieden we een open platform dat elk model ondersteunt, op elke accelerator, in elke omgeving”, zegt Joe Fernandes, VP & GM, AI Business Unit bij Red Hat.
Samenwerking met Google Cloud
Tijdens Red Hat Summit kondigden Red Hat en Google Cloud een samenwerking aan om de ingebruikname van AI-agents te versnellen door middel van:
  • De lancering van het llm-d open source-project, met Google als medeoprichter.
  • Ondersteuning voor vLLM op Google Cloud TPU’s en GPU-gebaseerde virtuele machines om AI-inference te verbeteren.
  • Directe Day 1-ondersteuning voor vLLM binnen Gemma 3-modeldistributies.
  • Ondersteuning voor Red Hat AI Inference Server op Google Cloud.
Het stimuleren van vooruitstrevende ontwikkeling van AI-agents, waarbij Red Hat bijdraagt aan de community van Googles Agent2Agent (A2A)-protocol.



Over Red Hat

Red Hat is wereldwijd dé provider van enterprise open source software, met een community-gedreven aanpak voor de ontwikkeling van betrouwbare en goed presterende Linux-, hybride cloud-, container- en Kubernetes-technologieën. Red Hat helpt klanten met de integratie van nieuwe en bestaande IT-applicaties, ontwikkeling van cloud-native applicaties, standaardisatie op een toonaangevend besturingssysteem, en de automatisering, beveiliging en het beheer van complexe IT-omgevingen. Red Hat is een trusted advisor voor Fortune 500-bedrijven, dankzij bekroonde support-, trainings- en consultancydiensten. Lees voor meer informatie het Red Hat blog, of volg Red Hat op X, Facebook, YouTube en LinkedIn.

Als strategische partner van cloudproviders, system integrators, applicatievendoren, klanten en open source-communities, helpt Red Hat organisaties zich voor te bereiden op de digitale toekomst.

Toekomstgerichte verklaringen
Met uitzondering van de hierin opgenomen historische informatie, kunnen verklaringen in dit persbericht toekomstgerichte verklaringen zijn in lijn met de Private Securities Litigation Reform Act van 1995. Toekomstgerichte verklaringen zijn gebaseerd op de huidige veronderstellingen van de onderneming over toekomstige bedrijfs- en financiële prestaties. Deze verklaringen gaan gepaard met een aantal risico's, onzekerheden en andere factoren waardoor de werkelijke resultaten wezenlijk kunnen verschillen. Elke toekomstgerichte verklaring in dit persbericht geldt alleen op de datum waarop ze wordt gedaan. Behalve indien wettelijk vereist, neemt de onderneming geen enkele verplichting op zich om toekomstgerichte verklaringen bij te werken of te herzien.


Voor meer persinformatie
Marlieke Tijman
+31 (0)23 555 34 24
redhat-nl@clarity.global
Recent van Red Hat  
Red Hat versterkt AI-infrastructuur met nieuwe producten en diensten

Red Hat introduceert nieuwe soevereine en private cloud-mogelijkheden voor digitale autonomie

Onderzoek van Red Hat: slechts 44% van Nederlandse organisaties heeft helder inzicht in waar hun data is opgeslagen

Verstreken tijd: 1 jaar en 34 dagen
PR contact  

Logo Clarity Benelux
Red Hat contact  

+31 20 5651200
www.redhat.com

Marcommit is hét full service B2B marketing bureau van Nederland! Wij helpen jouw bedrijf met offline en online marketing campagnes die écht werken.
 Spotlight  
Logo BTG
Logo NHA Opleidingen
Logo Polly.Help
Logo MI Consultancy
Logo Incentro
Logo Stromma Nederland
Logo Fairbanks
Logo Valid
Logo Westpoort
Logo Brownies.nl
Logo Nextview
Logo Examencentrum
Logo Keuze.nl BV
Logo VirtualPBX.nl
Logo Expertum
Logo Twenty Four Webvertising
Logo Web Wings
Logo Web Wings
Logo BusinessCom
Logo Msafe
Logo SCOS ViaCloud BV
Logo Keuze.nl BV
Logo Spryng
Logo BusinessCom
Logo Web Wings
Logo Web Wings
Logo Web Wings
Logo Web Wings
Logo Software Improvement Group (SIG)
Logo BusinessCom
Logo Workday
Logo IG&H
Logo KnowBe4
Logo NTT DATA
Logo osapiens
Logo Marcommit
Logo PARKSIDE
Logo Exact
Logo Onguard
Logo Lightspeed
Logo Conclusion
Logo Veeam Software
Logo Nutanix
Logo BTG
Logo Bechtle Groep Nederland
TARIEVEN
Publicatie eenmalig €49

PUBLICATIEBUNDELS
6 voor €199
12 voor €349
Onbeperkt €499

EENMALIG PLAATSEN
Persbericht aanleveren

REGELMATIG PLAATSEN
Bedrijfsabonnement
CONTACT
Persberichten.com
JMInternet
Kuyperstraat 48
7942 BR Meppel
Nederland
info@persberichten.com
KvK 54178096

VOLGEN
@ICTBERICHTEN

ZOEKEN
IT bedrijf
IT PR-bureau
OVER ONS
Persberichten.com, hét platform voor IT/Tech persberichten

DATABASE
103824 persberichten
7041 bedrijfsprofielen
60 PR-bureauprofielen
17518 tags

KENMERKEN
• Behouden tekstopmaak
• Foto/illustratie/logo
• Downloadbare bijlages
• Profiel met socials
 
ProgressCommunications.euwww.whizpr.nlwww.marcommit.nl
ProgressCommunications.euProgressCommunications.euwww.deepr.nl