fbpx

De bedste AI-modeller til fotorealistisk fotografering: august 2025

Googles "Nano Banana" har lige blandet kortene. Midjourney V7 er fortsat kongen af stil, mens ChatGPT-5 gør chatten mere bekvem.

Najboljši AI modeli za fotorealistične fotografije
Foto: Jan Macarol / Ai art

De bedste AI-modeller til fotorealistiske fotos?! I de sidste to uger er Googles "Nano Banana" (officielt: Gemini 2.5 Flash Image) kommet på banen og har vendt internettet på hovedet - takket være dens fremragende identitetsbevarelse og redigering på flere niveauer. I mellemtiden fortsætter Midjourney V7 med at skinne æstetisk, og ChatGPT-5 tilbyder fotorealistiske resultater direkte i chatten. Dette er en hurtig, men præcis guide til, hvilket værktøj man skal vælge til de smukkeste "AI-fotos" - fra portrætter til produktbilleder.

De bedste AI-modeller til fotorealistisk fotografering?! Professionelle fotos krævede tidligere et budget, et team og tålmodighed. Nu ser det ud til, at alt, hvad du behøver, er en god idé, nogle referencer ... og en model med øgenavnet efter en frugt. Google har tilføjet en ny funktion til sin app i de seneste dage. tvilling inkluderede en ny model til generering og redigering af billeder – internt kaldet "Nano Banana", men officielt Gemini 2.5 Flash-billedeDen håndterer flere fotoblandinger, tegnbevarelse og præcise lokale korrektioner, alt sammen med en simpel tekstkommando. For at være klar: alle udgivne billeder er også markeret med et usynligt SynthID-vandmærke. Så dette er de bedste AI-modeller til fotorealistisk fotografering lige nu. Og forfatteren af denne artikel har testet dem alle for dig.

Foto: Jan Macarol / Ai art
Baseret på et portrætfoto og styling fra Zara kan du skabe et look med en meget simpel og kort prompt.

Hvad er "Nano Banana" (Gemini 2.5 Flash Image) – og hvorfor er det i rampelyset lige nu?

Den 26. august udgav Google officielt Gemini 2.5 Flash Image (også kendt som "nano-banan") og inkluderede det i Gemini-applikationen. Fokus: bevarelse af identitet en person eller et objekt på tværs af flere redigeringer og scener, flerbilledfusion (sammenlægning af flere inputbilleder) og målrettet redigering på flere niveauer med et letforståeligt sprog. Modellen bag kulisserne forstår verden ("verdenskendskab"), hvilket hjælper med realistiske detaljer (fra teksturer til belysning). Alt genereret eller redigeret er markeret med et synligt og usynligt SynthID-stempel.

Hvorfor interesserer dette fotografiske perfektionister? Fordi AI-værktøjer længe har "korrumperet" menneskers udseende efter to eller tre redigeringer. Nano Banana lukker specifikt dette hul og er allerede øverst på LMArena-hitlisterne for billedredigering; den er tilgængelig i Gemini-applikationen med en daglig redigeringsgrænse (mere for betalende brugere).

Foto: Jan Macarol / Ai art / Nano Banana

Bonus: Adobe bekræftede den 26. august, at Gemini 2.5 Flash-billede også tilgængelig i Adobe Firefly og Adobe Express — officiel anerkendelse af, at arbejdsgange med flere modeller nærmer sig en ny standard.

Hvem laver det "mest fotografiske" arbejde i øjeblikket? De bedste AI-modeller til fotorealistisk fotografering?

Toms guide er i går sammenlignede ChatGPT-5 og Gemini 2.5 Pro i ni billedopgaver. Resultat: Gemini vandt seks ud af ni, især inden for fotorealisme, krævende belysning, bevægelsessløring og konsekvent sporing af krav. ChatGPT-5 var stærkere i kunstnerisk fortolkning og atmosfære. Hvis du vil have "præcis som i briefingen" — Gemini; hvis du vil have lidt mere "ånd" — ChatGPT.

De bedste modeller til fotorealistisk fotografering i dag

Google Gemini 2.5 Flash-billede ("Nano Banana")

Hvornår skal man vælge: Portrætter og produktkompositioner, hvor det skal den samme karakter forbliver den samme i forskellige miljøer, eller hvor du har brug for redigering i flere trin (ændring af baggrunde, ændring af outfits, blanding af to billeder til ét).
Hvorfor: Stærk bevarelse af identitet, flerbilledfusion og redigering af naturligt sprog; tilgængelig i Gemini-appen (også for gratis brugere med en daglig grænse). Alt indhold er markeret med SynthID.

Nyheder fra de sidste par dage: officiel integration i Gemini-applikationen; derudover er modellen inkluderet i Adobe Firefly/Express, hvilket betyder, at teamet kan bruge det samme sæt kreative værktøjer i velkendte Adobe-arbejdsgange.

Foto: Jan Macarol / Ai art

Midjourney V7

Hvornår skal man vælge: Mode-/redaktionel æstetik, stilistisk sammenhængende "kampagne"-visualitet og projekter, hvor man ønsker en flydende dialog mellem referencer og stil.
Hvorfor: V7 blev standardmodellen i juni og bringer Omni-reference (--oref) for ensartede karakterer, Kladdetilstand for ~10 gange hurtigere udkast og bedre sammenhæng mellem kroppe, hænder og genstande. V7 er også et spring fremad med hensyn til "hud" og teksturer. Derudover har Midjourney i de seneste måneder forvandlet sig til mere et "arbejdsstudie" med på lærred redigering, lag og reteksturering.

ChatGPT-5 (inklusive GPT-billede / 4o-billedgenerering)

Hvornår skal man vælge: Når du vil have alt samlet i én chat – fra briefing til generation – og når du værdsætter det hurtig iteration med god fotorealisme, men også med kunstnerisk fortolkning.
Hvorfor: ChatGPT fik sin egen billedgenerering i år (efterfølger til DALL·E), som er stærk inden for tekstforståelse og samtaleintegration. I gårsdagens sammenligning tabte ChatGPT-5 til Gemini 2.5 Pro, men var stærkere inden for kreativ atmosfære og stilisering.

Adobe Firefly (Image Model 4 / Ultra) — + ny integration med Gemini

Hvornår skal man vælge: Hvis du arbejder i Creative Cloud og har brug for kommercielt sikker datakilder, ensartede rettigheder og en hurtig overgang til Photoshop/Illustrator/Premiere.
Hvorfor: Firefly 4/Ultra sigter mod højere fotorealisme og er designet til professionelle arbejdsgange (Boards, Express, CC-integration). Seneste nyt: I Firefly/Express kan du nu også ringe Gemini 2.5 Flash-billede — dette er praktisk talt et "multimodel"-arbejdsmiljø.

Black Forest Labs — FLUX.1 (Kontext / Pro)

Hvornår skal man vælge: Når du vil kombinere hastighed + god og hurtig sporing og arbejde med referencer (kampagner, moodboards, kataloger).
Hvorfor: FLUX.1 Kontext satte fokus på kontekst og redigering, mens FLUX 1.1 Pro er en hurtig basis for kvalitetsgengivelser med en god forståelse af instruktioner.

Stabil lokal variant: Stabil Diffusion 3,5

Hvornår skal man vælge: Hvis du vil lokalt arbejde, finjustere pipelinen (ComfyUI, LoRA) og have tid til optimering.
Hvorfor: SD 3.5 har en betydeligt forbedret kvalitet og fås i en række forskellige konfigurationer, fra "Large" til hurtigere builds og enterprise-pakker. Det er ikke trivielt, men det er fleksibelt.


Foto: Jan Macarol / Ai art / Nano Banana

Hurtige SOS-tips til fotorealisme (uanset model)

  • Skriv optikken ned: 35 mm for en reportagefølelse, 50/85 mm til et portræt, f/1,8–2,8 for lav dybdeskarphed.
  • Giv lyset en opgave: "vinterens nordvindue", "gyldne time", "blødt diffust lys".
  • Skriv områderne ned: hud (støv, porer, fine rynker), teksturer (bomuld, børstet stål), materialer.
  • Undgå "AI-tåge": anmodning skarpe kanter, naturligt korn og reelle uregelmæssigheder (fine rynker på tøjet, mikrofordeling af hår).
  • For karakterkonsistens: Brug referencefotos/omni-referencer (hvor tilgængelige) og bemærk ensartede attributter (øjenfarve, modermærke, frisure).

Hvilket værktøj skal man vælge efter scenarie

  • Portrætter med flere outfits/settings, men det samme ansigt: Gemini 2.5 Flash Image (Nano Banana) — opretholder identitet på den mest pålidelige måde på tværs af en række redigeringer; fremragende til redaktionelt arbejde/reklamer.
  • Kampagnestil og "heltebillede"-æstetik: Midjourney V7 — premium-teksturer, hud- og stilsammenhæng, hurtig udkast med udkasttilstand.
  • Hurtig kreativ cyklus i chatten (kort → billede): ChatGPT-5 — fantastisk til dialoggentagelser; til strengt fotorealistiske krav slog Gemini det i test.
  • Agenturflow med CC og rettigheder: Adobe Firefly (med købsoption) Gemini 2.5 Flash-billede inde i Firefly/Express).
  • Fleksibelt gør-det-selv-arbejde og lokalt arbejde: Stabil diffusion 3,5 eller FLUX.1 (Kontekst/Professionel).

Konklusion: Ja, “Nano Banana” er sandelig blandt de bedste til fotografering

Hvis du arbejder med mennesker, dyr eller produkter, hvor skal identitet til at overleve en række redigeringer, er Nano Banana i øjeblikket det mest pålidelige svar – med understøttelse i Gemini, frisk integration i Adobes økosystem og konkrete tests, der bekræfter Gemini's fordel inden for fotorealisme og teknisk nøjagtighed. Midjourney V7 forbliver stilmesteren, og ChatGPT-5 er bekvemmelighed og kreativitet i ét vindue. Bedst af alt? Du behøver ikke at vælge én: 2025 er året multimodel kreativitet.

Mere information

Billederne er alle skabt med kunstig intelligens. 

Med dig siden 2004

Fra år 2004 vi forsker i urbane tendenser og informerer vores fællesskab af følgere dagligt om det seneste inden for livsstil, rejser, stil og produkter, der inspirerer med passion. Fra 2023 tilbyder vi indhold på store globale sprog.