Very interesting article about training data for AI.
1) Their rights or not to use the data they use for the training.
2) What they use for training. Beside limited to data that is digital, it also is limited what digital data they use.
If I understand correctly, their analyse of Google C4 dataset, my own personal website is far more important than the biggest Swedish newspaper!
https://www.washingtonpost.com/technology/interactive/2023/ai-chatbot-learning/
#AI
Sidan har också en sökfunktion där man kan se rankingen för C4 för olika webbsidor. Tex min hemsida och stora dagstidningen:
hemrin.com. Ranking: 801,105. Tokens: 29k. Of total tokens: 0.00002%
dn.se. Ranking: 13,169,728. Tokens: 120. Of total tokens: 0.00000008%
Om jag förstår detta rätt, så lägger alltså denna Google-träning större vikt vid vad jag skriver på min hemsida än vad DN skriver!
https://www.washingtonpost.com/technology/interactive/2023/ai-chatbot-learning/
3/3
2) En annan viktig aspekt är vad de verkligen lär sig av. För det första är det ju förstås begränsat till data som finns digitalt. För det andra så är det bara en liten del av allt som finns digitalt som de använder sig av.
Den här artikeln från Washington Post tittar närmare på data för Googles C4s dataset, som är möjligt att analysera. Jag känner inte till närmare hur den används.
2/?
Det här tycker jag är en intressant artikel om vad som används för att träna AI när det handlar om texter och sådant.
1) Dels en fråga om vilka rättigheter har verkligen företag att använda data från internet för att träna sina verktyg, som de kanske dessutom ska använda kommersiellt och tjäna pengar på? Hur får de använda tex copyright-data för att träna datorn?
1/?
"Content without consent" is a concern that I could see catching on as more people gradually realize the content they've published and posted over the years is being secretly used to train for-profit AI models. https://www.washingtonpost.com/technology/interactive/2023/ai-chatbot-learning/
No Trespassing! Välkomna till Domkyrkan, Göteborg onsdag den 19 april kl 18.00. Inom ramen för Vetenskapsfestivalen 2023 samtalar jag, @vanstrastranden och Michael Nausner om gränser och gränssättningar. https://www.vetenskapsfestivalen.se/for-alla/no-trespassing/6001/#single-event-description
Miljöpartiet säger nu nej till ChatControl - i dess nuvarande form.
https://www.mp.se/just-nu/darfor-sager-mp-nej-till-chat-control/
@reality2cast @katherined @dsearls It was interesting in general listen to the episode. I recall Doc said a difference is that we humans don't necessarily know how the sentence we start to say/write will end.
I came to think of the old line printers. How impressive it was that it could printe every second row backwards (saving the need for the printer head to return), it already knew what to print and could do it backwards!
@reality2cast @katherined @dsearls I liked your reflection that it is so much talk, wake up, re AI now when generative AI (correct term?) is in phocus and so available. Despite that there already are so many other types of AI in use and development.
One reason it's so important for us to reclaim social media is that it's a space where we collectively imagine our future.
If we allow the spaces for our imagination to be shaped, defined, and constrained by Elon Musk and Mark Zuckerberg, we are ultimately placing limits on what's possible in reality.
We’re part of an open letter asking the UK government to rethink the Online Safety Bill to protect end-to-end encryption and respect privacy.
Read the letter here: https://element.io/blog/the-uks-online-safety-bill-undermines-everyones-safety
digiKam 8.0.0. has been released. Check it out!
https://www.digikam.org/news/2023-04-16-8.0.0_release_announcement/
@PublicLewdness The Volla phone HW is to my understanding developed and manufactured by Gigaset. I would guess Gigaset use same battery, I suggest if you have trouble to get a spare battery from Volla, check if it is possible from Gigaset.
By the way, pity to hear you had problem with /e/. I have started to use it very recently (on a Samsung S9 that I flashed myself). Volla really interests me. I listed OS I am aware of in a blog post, in Swedish, recently (updating): https://www.hemrin.com/business-blog/380-mobiltelefon-med-nagot-annat-an-apple-ios-eller-google-android
Förut kunde man ha flera Mobilt BankID på samma apparat. Det kan man inte göra sedan en tid (de som redan är skapade kan fortsatt finnas). Det betyder att varje person måste ha en egen apparat. Men också var sin egen reservapparat, om man vill ha ett extra Mobilt BankID i reserv om något händer med ens vanliga apparat. #BankID
Även tidningen Sändarens ledarsida tar upp problematiken med ChatControl och övervakning. (Sändaren är en nyhetstidning som kommer varje vecka, som står nära Equmeniakyrkan) https://www.sandaren.se/ledare/kyrkor-riskerar-bli-overvakade #chatcontrol
Wild and crazy är kanske bra strategi för trädgården! https://www.dn.se/debatt/lat-grasklipparen-sta-for-naturens-skull/
Den andra kommer från dagens lördagsintervju i P1 med V-ledaren Dadgostar. Hon använde flera ggr ord typ vänsterblock; ord med "vänster" i för att tala om forma alternativ till dagens regering. Jag förstår henne som menandes V, S, MP och C. Där tror jag hon får problem så länge hon talar om alternativet som "vänster", särskilt men inte enbart C; jag tror inte en formation med C eller C-väljare passar att självbeskriva som ingående i vänsteralternativ.
#svpol 2/2
Två politiketikettfunderingar att reagera på:
SD har på senaste åren ofta fått etiketten höger. Tidigare var det inte så (om jag minns rätt). Att de är etiketteras som ett konservativt parti är rimligt, men höger tycker jag är betydligt mer tveksamt.
#svpol 1/2
Engineer with University Diploma in Human Rights & Democracy. Job competence: Component Engineer; fiber optics and more components, Component Handling Process and IT System owner. Linux, open source, photography and religion to mention a few interest areas. Joomla for web sites. English and Swedish. Located in Sweden. DM inactivated.
#HumanRights #Democracy #ComponentEngineer #FiberOptics #FibreOptics #Linux #LinuxMint #Joomla #OpenSource #Photography #Religion #Engineer