Show more

Very interesting article about training data for AI.
1) Their rights or not to use the data they use for the training.
2) What they use for training. Beside limited to data that is digital, it also is limited what digital data they use.

If I understand correctly, their analyse of Google C4 dataset, my own personal website is far more important than the biggest Swedish newspaper!

washingtonpost.com/technology/

Sidan har också en sökfunktion där man kan se rankingen för C4 för olika webbsidor. Tex min hemsida och stora dagstidningen:

hemrin.com. Ranking: 801,105. Tokens: 29k. Of total tokens: 0.00002%

dn.se. Ranking: 13,169,728. Tokens: 120. Of total tokens: 0.00000008%

Om jag förstår detta rätt, så lägger alltså denna Google-träning större vikt vid vad jag skriver på min hemsida än vad DN skriver!
washingtonpost.com/technology/

3/3

Show thread

2) En annan viktig aspekt är vad de verkligen lär sig av. För det första är det ju förstås begränsat till data som finns digitalt. För det andra så är det bara en liten del av allt som finns digitalt som de använder sig av.

Den här artikeln från Washington Post tittar närmare på data för Googles C4s dataset, som är möjligt att analysera. Jag känner inte till närmare hur den används.
2/?

Show thread

Det här tycker jag är en intressant artikel om vad som används för att träna AI när det handlar om texter och sådant.
1) Dels en fråga om vilka rättigheter har verkligen företag att använda data från internet för att träna sina verktyg, som de kanske dessutom ska använda kommersiellt och tjäna pengar på? Hur får de använda tex copyright-data för att träna datorn?

1/?

"Content without consent" is a concern that I could see catching on as more people gradually realize the content they've published and posted over the years is being secretly used to train for-profit AI models. washingtonpost.com/technology/

Show thread

No Trespassing! Välkomna till Domkyrkan, Göteborg onsdag den 19 april kl 18.00. Inom ramen för Vetenskapsfestivalen 2023 samtalar jag, @vanstrastranden och Michael Nausner om gränser och gränssättningar. vetenskapsfestivalen.se/for-al

One reason it's so important for us to reclaim social media is that it's a space where we collectively imagine our future.

If we allow the spaces for our imagination to be shaped, defined, and constrained by Elon Musk and Mark Zuckerberg, we are ultimately placing limits on what's possible in reality.

We’re part of an open letter asking the UK government to rethink the Online Safety Bill to protect end-to-end encryption and respect privacy.

Read the letter here: element.io/blog/the-uks-online

Förut kunde man ha flera Mobilt BankID på samma apparat. Det kan man inte göra sedan en tid (de som redan är skapade kan fortsatt finnas). Det betyder att varje person måste ha en egen apparat. Men också var sin egen reservapparat, om man vill ha ett extra Mobilt BankID i reserv om något händer med ens vanliga apparat.

Även tidningen Sändarens ledarsida tar upp problematiken med ChatControl och övervakning. (Sändaren är en nyhetstidning som kommer varje vecka, som står nära Equmeniakyrkan) sandaren.se/ledare/kyrkor-risk

Den andra kommer från dagens lördagsintervju i P1 med V-ledaren Dadgostar. Hon använde flera ggr ord typ vänsterblock; ord med "vänster" i för att tala om forma alternativ till dagens regering. Jag förstår henne som menandes V, S, MP och C. Där tror jag hon får problem så länge hon talar om alternativet som "vänster", särskilt men inte enbart C; jag tror inte en formation med C eller C-väljare passar att självbeskriva som ingående i vänsteralternativ.
2/2

Två politiketikettfunderingar att reagera på:
SD har på senaste åren ofta fått etiketten höger. Tidigare var det inte så (om jag minns rätt). Att de är etiketteras som ett konservativt parti är rimligt, men höger tycker jag är betydligt mer tveksamt.
1/2

Code paid by the people should be available to the people! 💪🏽

Publicly financed software developed for the public sector should be available under a Free -and Open Source- Software licence.

Wanna explain it to other? Use this video
📺 media.fsfe.org/w/7cH6EATpmPwaM

#PMPC #SoftwareFreedom

Yesterday a high school student working on a paper emailed me with a question:

“Through ChatGPT i find that you have a article named: "Teaching History in the Age of YouTube and Wikipedia" but i am not finding it”

You’re not finding it because I never wrote it. ChatGPT, as usual, is making shit up.

Jag är ju gammal schackspelare. Och nu var det dags för oss som står på barnens sida i #ChatControl 2.0-debatten att gå ut med drottningen (Anne-Marie Eklund Löwinder).

Schackmatt, Ylva Johansson.

dn.se/debatt/eu-skrams-med-ped

As long as the code behind "smart" home devices is proprietary, these companies are free to spy on us as much as they like. Help us fight back: tell your friends about free software and urge then to join the FSF! Support #FreeSoftware. fsf.org

🇫🇷 Kravaller på Paris gator efter att Macrons pensionsreform (eller åtminstone merparten av den) fick klartecken av Frankrikes författningsråd. Min och fotograf Mehdi Chebils rapport. 👇 #Frankrike dn.se/varlden/ilska-och-orolig

Show more
Librem Social

Librem Social is an opt-in public network. Messages are shared under Creative Commons BY-SA 4.0 license terms. Policy.

Stay safe. Please abide by our code of conduct.

(Source code)

image/svg+xml Librem Chat image/svg+xml